單晶片技術力不行先拿系統和堆疊來湊,作為應急方案也大有可為,你就說算力夠不夠吧。至於耗電散熱的問題以現階段AI的暴力程度更重要的是算法的優化製程反倒是其次了有了應急方案作為世界第一製造大國晶圓製程的技術積累只待水到渠成。
5月30日消息,华为宣布推出参数规模高达7180亿的全新模型盘古Ultra MoE,这是一个全流程在昇腾AI计算平台上训练的准万亿MoE模型。据悉,盘古团队提出Depth-Scaled Sandwich-Norm(DSSN)稳定架构和TinyInit小初始化的方法,在昇腾平台上实现了超过18TB数据的长期稳定训练。在训练方法上,华为团队首次披露在昇腾CloudMatrix 384超节点上打通大稀疏比MoE强化学习(RL)后训练框架的关键技术,使RL后训练进入超节点集群时代。https://caifuhao.eastmoney.com/news/1555605359
都沒人找找原文彭博社訪問第4:20老黃親口說很多事實證明ground truth華為最新晶片"comparable to a H200"https://www.bloomberg.com/news/articles/2025-05-29/nvidia-ceo-warns-that-chinese-ai-rivals-have-become-formidable