AI有智慧
  • AI智慧说
  • AI智慧秀
    • Ai教育
    • Ai技术
  • AI工具集
  • AI模型
  • ChatGPT入门
  • Prompt技巧
  • ChatGPT试用
    • 小睿老师- 智能助理
    • 小睿老师-案例锦集
    • 活动专区
  • AI智慧说
  • AI智慧秀
    • Ai教育
    • Ai技术
  • AI工具集
  • AI模型
  • ChatGPT入门
  • Prompt技巧
  • ChatGPT试用
    • 小睿老师- 智能助理
    • 小睿老师-案例锦集
    • 活动专区
  1. 首页
  2. 标签
  3. 张量
Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效

AI智慧秀 Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效

近日,字节跳动豆包大模型团队与香港大学联合提出了 ByteCheckpoint。

300次阅读 0个评论
AI智慧秀 2024-08-12
算法、系统和应用,三个视角全面读懂混合专家(MoE)

AI智慧秀 算法、系统和应用,三个视角全面读懂混合专家(MoE)

LLM 很强,而为了实现 LLM 的可持续扩展,有必要找到并实现能提升其效率的方法,混合专家(MoE)就是这类方法的一大重要成员。

340次阅读 0个评论
AI智慧秀 2024-07-26
这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单

AI智慧秀 这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单

随着大型语言模型(LLM)规模不断增大,其性能也在不断提升。

585次阅读 2个评论
AI智慧秀 2024-06-06
再战Transformer!原作者带队的Mamba 2来了,新架构训练效率大幅提升

AI智慧秀 再战Transformer!原作者带队的Mamba 2来了,新架构训练效率大幅提升

自 2017 年被提出以来,Transformer 已经成为 AI 大模型的主流架构,一直稳居语言建模方面 C 位。

450次阅读 0个评论
AI智慧秀 2024-06-04
优于SOTA,腾讯AI Lab开发双重扩散模型

AI智慧秀 优于SOTA,腾讯AI Lab开发双重扩散模型

腾讯 AI lab、香港城市大学、锐格医药(Regor Therapeutics Group)的研究人员开发了一种条件深度生成模型 PMDM,用于生成适合特定靶标的 3D 分子。

518次阅读 2个评论
AI智慧秀 2024-03-29
英伟达吞噬世界!新架构超级GPU问世,AI算力一步提升30倍

AI智慧秀 英伟达吞噬世界!新架构超级GPU问世,AI算力一步提升30倍

「这才是我理想中的 GPU。」—— 黄仁勋。

436次阅读 2个评论
AI智慧秀 2024-03-19
  • «
  • 1
  • 2
分类目录
Ai技术
Ai教育
AI智慧秀
AI智慧说
ChatGPT入门
Prompt技巧
未分类
Copyright Ai有智慧 @2023 京ICP备18013468号