AI有智慧
  • AI智慧说
  • AI智慧秀
    • Ai教育
    • Ai技术
  • AI工具集
  • AI模型
  • ChatGPT入门
  • Prompt技巧
  • ChatGPT试用
    • 小睿老师- 智能助理
    • 小睿老师-案例锦集
    • 活动专区
  • AI智慧说
  • AI智慧秀
    • Ai教育
    • Ai技术
  • AI工具集
  • AI模型
  • ChatGPT入门
  • Prompt技巧
  • ChatGPT试用
    • 小睿老师- 智能助理
    • 小睿老师-案例锦集
    • 活动专区
  1. 首页
  2. 标签
  3. 下游任务
NeurIPS 2024 | 大模型的词表大小,同样适用于Scaling Law

AI智慧秀 NeurIPS 2024 | 大模型的词表大小,同样适用于Scaling Law

研究大型语言模型(LLMs)的扩展法则(scaling laws)时,以前的工作主要关注模型参数和训练数据的大小,而忽略了词表大小的作用。

437次阅读 0个评论
AI智慧秀 2024-10-11
23亿参数,Transformer架构,NASA、IBM发布「天气+气候」通用AI模型Prithvi WxC

AI智慧秀 23亿参数,Transformer架构,NASA、IBM发布「天气+气候」通用AI模型Prithvi WxC

9 月 23 日,IBM 与 NASA 合作发布了一个用于天气和气候的新型通用 AI 模型 Prithvi WxC,该模型可以在台式计算机上运行,且开源。

517次阅读 0个评论
AI智慧秀 2024-09-24
明确了:文本数据中加点代码,训练出的大模型更强、更通用

AI智慧秀 明确了:文本数据中加点代码,训练出的大模型更强、更通用

代码知识原来这么重要。

388次阅读 0个评论
AI智慧秀 2024-08-22
分类目录
Ai技术
Ai教育
AI智慧秀
AI智慧说
ChatGPT入门
Prompt技巧
未分类
Copyright Ai有智慧 @2023 京ICP备18013468号