AI智慧秀 仅用4块GPU、不到3天训练出「开源版GPT-4o」,这是国内团队最新研究 LLaMA-Omni能够接收语音指令,同步生成文本和语音响应,响应延迟低至 226ms,低于 GPT-4o 的平均音频响应延迟 320ms。