AI智慧秀 自动化、可复现,基于大语言模型群体智能的多维评估基准Decentralized Arena来了 研究者们已经并陆续构建了成千上万的大规模语言模型(LLM),这些模型的各项能力(如推理和生成)也越来越强。