今日,字節(jié)跳動豆包大模型團(tuán)隊提出了全新的稀疏模型架構(gòu) UltraMem,該架構(gòu)有效解決了MoE推理時高額的訪存問題,推理速度較 MoE 架構(gòu)提升2-6倍,推理成本最高可降低83%。目前,國內(nèi)外大模型領(lǐng)