AI智慧秀 NeurIPS 2024 | 大模型的词表大小,同样适用于Scaling Law 研究大型语言模型(LLMs)的扩展法则(scaling laws)时,以前的工作主要关注模型参数和训练数据的大小,而忽略了词表大小的作用。
AI智慧秀 AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的 AMD vs 英伟达绝对算是一个长盛不衰的话题 —— 从玩游戏用哪家强到如今训练 AI 哪个更高效?原因也很简单:它们的 GPU 产品存在直接竞争关系。