性能 - AI有智慧

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Mamba

AI智慧秀 北大林宙辰团队全新混合序列建模架构MixCon：性能远超Mamba

在自然语言处理、语音识别和时间序列分析等众多领域中，序列建模是一项至关重要的任务。

NeurIPS 2024 | 大模型的词表大小，同样适用于Scaling Law

AI智慧秀 NeurIPS 2024 | 大模型的词表大小，同样适用于Scaling Law

研究大型语言模型（LLMs）的扩展法则（scaling laws）时，以前的工作主要关注模型参数和训练数据的大小，而忽略了词表大小的作用。

英伟达RTX 5090功耗高达600W，32G显存，核心比5080多一倍

AI智慧秀 英伟达RTX 5090功耗高达600W，32G显存，核心比5080多一倍

RTX 50 系列的发布日期可能会在明年初。

AMD的GPU跑AI模型终于Yes了？PK英伟达H100不带怕的

AI智慧秀 AMD的GPU跑AI模型终于Yes了？PK英伟达H100不带怕的

AMD vs 英伟达绝对算是一个长盛不衰的话题 —— 从玩游戏用哪家强到如今训练 AI 哪个更高效？原因也很简单：它们的 GPU 产品存在直接竞争关系。