AI智慧秀 NeurIPS 2024 | 大模型的词表大小,同样适用于Scaling Law 研究大型语言模型(LLMs)的扩展法则(scaling laws)时,以前的工作主要关注模型参数和训练数据的大小,而忽略了词表大小的作用。