
yangyang
文章 929
AI智慧秀 NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构的高效性能
大型语言模型(LLMs)虽然在适应新任务方面取得了长足进步,但它们仍面临着巨大的计算资源消耗,尤其在复杂领域的表现往往不尽如人意。
AI智慧秀 SAM 2.1上新、Lingua代码库发布,一大波Meta开源工具来袭
今天,Meta 分享了一系列研究和模型,这些研究和模型支撑 Meta 实现高级机器智能(AMI)目标,同时也致力于开放科学和可复现性。
AI智慧秀 Jurgen、曼宁等大佬新作:MoE重塑6年前的Universal Transformer,高效升级
7 年前,谷歌在论文《Attention is All You Need》中提出了 Transformer。
AI智慧秀 又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!
大模型中,线性层的低比特量化(例如 INT8, INT4)已经逐步落地;对于注意力模块,目前几乎各个模型都还在用高精度(例如 FP16 或 FP32)的注意力运算进行训练和推理。
AI智慧秀 加码电站硬科技,阳光新能源重磅发布电站“魔方”技术平台!
10月18日,阳光新能源在北京召开“以‘不变’应万变——电站创新技术发布会”,重磅发布新能源电站“魔方”技术平台。
AI智慧秀 大模型步入「推理Scaling」时代,SambaNova如何挑战英伟达的霸主地位?
OpenAI o1 的发布,再次给 AI 领域带来了一场地震。
AI智慧秀 从结构准确预测蛋白质功能,东北大学「CNN+GCN」统一框架,优于现有方法
东北大学的研究人员从蛋白质结构出发,提出将卷积神经网络 (CNN)和图卷积网络 (GCN)结合成一个统一框架,称为双模型自适应权重融合网络 (Two-
AI智慧秀 以图灵机为师:通过微调训练让大语言模型懂执行计算过程
大型语言模型 (LLM) 在各种自然语言处理和推理任务中表现出卓越的能力,某些应用场景甚至超越了人类的表现。
热门文章

谷歌发布 1800 元/月的 AI 订阅,还把「通用 AI」塞进了生态每个角落
软件硬件双管齐下,定义「下一代 AI 产品」怎么做。

中国 AI 大厂,被 Deepseek 掀了牌桌之后
当技术范式重构,强者也不得不重新起跑。

测评 | 从实验室到茶水间,可量产万元全尺寸具身机器人全网首测
万元级机器人要来了,下一站可能就是你家楼下商场。

腾讯 AI「登陆战」
从「造模型」到「用好模型」,腾讯想做 AI 落地的那双手

深度剖析 Google AI 眼镜战略:「百镜大战」没来,但谷歌想用 Gemini「再次伟大」
戴上 Gemini 很美好,做出这副眼镜太不易。