AI智慧秀 NeurIPS 2024 | 大模型的词表大小,同样适用于Scaling Law 研究大型语言模型(LLMs)的扩展法则(scaling laws)时,以前的工作主要关注模型参数和训练数据的大小,而忽略了词表大小的作用。
AI智慧秀 一文看懂LLM推理,UCL汪军教授解读OpenAI ο1的相关方法 OpenAI 最近发布的 o1 系列模型堪称迈向强人工智能的一次飞跃,其强大的推理能力为我们描绘出了下一代人工智能模型的未来图景。
AI智慧秀 NeurIPS 2024|SparseLLM:突破性全局剪枝技术,大语言模型稀疏化革命 随着大型语言模型(LLMs)如 GPT 和 LLaMA 在自然语言处理领域的突破,现如今的模型能够在各种复杂的语言任务中表现优异。
AI智慧秀 不出所料!Jürgen又站出来反对Hinton得诺奖,Nature也炮轰提名过程不透明 今年的诺贝尔物理学奖颁给了两位享誉盛名的 AI 研究者 John J. Hopfield 和 Geoffrey E. Hinton,这确实让很多人感到意外。
AI智慧秀 快多个数量级,清华更高精度、更泛化的深度学习电子结构计算方法登Nature子刊 团队开发了一种准确而有效的实空间重构方法(real-space reconstruction),将 DeepH 方法从原先仅支持原子基组推广至适用于平面波基组