AI智慧秀 NeurIPS 2024 | 大模型的词表大小,同样适用于Scaling Law 研究大型语言模型(LLMs)的扩展法则(scaling laws)时,以前的工作主要关注模型参数和训练数据的大小,而忽略了词表大小的作用。
AI智慧秀 23亿参数,Transformer架构,NASA、IBM发布「天气+气候」通用AI模型Prithvi WxC 9 月 23 日,IBM 与 NASA 合作发布了一个用于天气和气候的新型通用 AI 模型 Prithvi WxC,该模型可以在台式计算机上运行,且开源。