芯片国产替代升级 “龙芯”发布新一代处理器

作为“中国芯”的代表之一,“龙芯”24日发布自主研发的新一代通用处理器(CPU),单核通用处理性能大幅提升,并实现了CPU和主板升级均不影响操作系统兼容性。

新华社12月24日报道,龙芯中科技术有限公司董事长、中国科学院计算技术研究所研究员胡伟武当天表示,新一代通用处理器3A4000/3B4000使用28纳米工艺,通过设计优化,性能达到上一代产品的两倍以上,主频达到1.8G赫兹至2.0G赫兹。芯片所有源代码均为自主设计,在处理器核内设计了安全控制机制,同时提供开源的基础版操作系统支持下游企业,龙芯CPU和主板升级均不影响操作系统及应用的兼容性。

“要与国际芯片巨头同台竞技,首先要通过几级阶梯登上‘台’去,龙芯现在就是在走最后一级阶梯。”胡伟武说,在此基础上,龙芯将于明后年推出使用12纳米工艺的新CPU,主频提高到2.5G赫兹以上,通用处理性能有望达到产品级的世界先进水平。

龙芯脱胎于中科院计算所,目前在党政办公、航天、金融、能源等领域有着较为广泛的应用,正在探索建立“微软+英特尔”体系、“ARM+安卓”体系之外的又一套信息产业生态体系。据统计,2019年龙芯芯片出货量达到50万颗以上。

中科院科学传播局局长周德进说,龙芯“20年磨一剑”,通过自主研发掌握CPU的核心技术,矢志建设自主创新的信息产业体系,体现了中国科学家的担当。

当天的发布会上,联想、中科曙光、方正、中国运载火箭技术研究院等也发布了基于龙芯新一代通用处理器的桌面计算机、笔记本、服务器、网络安全设备、工业控制计算机等产品。
科工力量:龍芯3A4000工藝不變性能翻倍,怎麼做到的?

2019-12-25 08:35:02

【文/科工力量專欄作者鐵流】

日前,龍芯在國家會議中心舉辦龍芯中科2019產品發布暨用戶大會。這次大會最大的亮點就是龍芯發布了3A4000處理器。

3A4000與3A3000一樣,都採用28nm工藝,雖然工藝相同,但在性能上實現了性能翻倍。相對於那些在性能提升上高度依賴台積電先進工藝和國外技術支持的CPU,龍芯完全依靠自身的設計能力實現CPU性能翻倍,這在國內是極其罕見的,充分證明了自主研發後勁,展現出龍芯厚積薄發的功力。



龍芯28nm CPU超越16nm ARM CPU

芯片的性能主要在芯片的設計和芯片的製造,就設計這一塊,主要靠IC設計公司,就製造這一塊,則主要仰仗台積電這類晶圓廠。誠然,部分設計工作和製造結合的很緊密,如果磨合的好的話可以威力倍增,比如英特爾用45nm工藝就可以把CPU主頻做到2.5G以上,而國內ARM陣營IC設計公司把CPU做到2.5 G以上則需要台積電7/10/12/16nm工藝配合。

因此,如果一家公司採用落後工藝,CPU性能反而超越了採用先進工藝的CPU,那麼,這足以說明這家採用落後工藝的CPU公司,其具備比較強的CPU設計能力。就這一點來說,龍芯與國內ARM陣營的友商就形成了這種對比。

以某ARM CPU來說,其IPC在過去5年裡提升相對有限,堪稱英特爾擠牙膏:

2014—2015年的某款CPU(28nm)單核性能為11左右(@2G),換算一下5.5/G;

之後的一款多核服務器CPU(28nm)的單核性能為12.4(@2G),換算一下6.2/G;

之後把工藝換成了16nm,出了一款多核服務器CPU,單核性能為13(@2.4G),換算一下5.4/G;

最近出了一款四核桌面芯片,2.6G主頻下定點16.5,換算一下是6.3/G。如果主頻滿血到3.0Ghz,那麼定點應該在19分左右。

另一家ARM CPU,其採用16nm工藝的時候,一款是買A57做SoC設計,還有一款是買A72做SoC設計。即便是A72那一款,單核定點成績也在17至18左右。

相比之下,採用28nm工藝的龍芯3A4000,單核定點18+(@1.8G),2G主頻下可以達到20+。

之所以在主頻落後的情況下,龍芯還能在性能上反超,根源就是龍芯在微結構設計水平上具有較強的能力。CPU的性能,不能只看工藝和主頻,微結構設計水平也非常關鍵,當年英特爾P4處理器主頻高達3G,但性能就是不行,並榮獲“高頻低能”的“美譽”。這兩款ARM CPU性能略遜色於龍芯3A4000,主要就是其微結構遜色於龍芯設計的GS464V,因而導致其主頻更高,但芯片性能略遜一籌。

龍芯延用28nm根源是囊中羞澀和發展規劃

不知為何,一些媒體因為龍芯採用28nm工藝就鄙夷龍芯技術不行,然而,這種觀點是值得商榷的,上28nm工藝還是7nm工藝,技術方面的因素偏少,錢方面的因素偏多,一些公司財大氣粗,或者獲得國家資源傾斜較多,自然有錢用台積電先進工藝。而龍芯在體量上無法與大公司相比,在獲得國家扶持方面也非常有限,在十二五之後,核高基等頂層設計重點扶持技術引進的X86和ARM CPU,技術引進企業獲得了鼎力扶持。

由於國家斷奶,龍芯只能在市場上摸爬滾打,依靠自己賺取的利潤和投資人的注資過日子。直到2015年,終於實現自收自支,自負盈虧。在有國家隊背景的幾家CPU公司中,拿不到政策資金補助,反而只能去拿橫琴利禾博股權投資基金、鼎暉投資、中海投資、北工投資等單位的風投,國內唯獨龍芯一家。

正是因為在資金上不寬裕,因而每一筆錢必須省著花,自然要精打細算,選擇最具性價比的工藝。

另外,選擇28nm工藝與龍芯的發展規劃也有很大關係,按照龍芯的規劃,是一代提升工藝,一代提升CPU核,龍芯3A2000、3A4000都是提升CPU核,3A3000和3A5000是提升製造工藝,選擇28nm這樣比較成熟的工藝,有助於降低CPU核升級中不確定因素帶來的風險,一旦發現問題,改進設計缺陷後重新流片的成本也低。在GS464V經過3A4000驗證後,就可以直接升級工藝流片,這樣就能降低3A5000研製的風險,提升3A5000的研發進度。某種程度上,3A4000其實是3A5000的墊腳石,為3A5000的研製做驗證。



展望龍芯3A5000

在龍芯3A4000的CPU核經過實踐驗證後,龍芯3A5000流片也水到渠成。此前,採用12/16nm的龍芯3A5000的測試片已經完成流片,這足以說明採用先進工藝流片對龍芯而言沒有什麼技術障礙,完全只是錢的問題,在當年開始研發3A4000的時候,龍芯財力有限,而且12/16nm工藝流片成本很貴。隨著12/16nm工藝流片費用下降,以及龍芯這幾年營收的增長,龍芯也有能力採用12/16nm工藝流片。參考龍芯3A2000到龍芯3A3000工藝升級的進度,龍芯3A5000的進度也會比較快。根據現場發布的PPT,龍芯3A5000將在2020年中流片,最遲年底前就會有成品。

必須說明的是,3A4000的工藝是28nm,潛力很大,換12/16nm工藝提升主頻就能把單核性能提升到25分——龍芯3A5000對內核小改後,換12/16nm工藝,性能有望達到25至27分,龍芯PPT裡30分的規劃偏樂觀。

另外,PPT上還有一個點值得關注,那就是龍芯7A2000橋片,龍芯7A1000橋片只是解決有無問題,一些接口都顯得比較有歷史的厚重感,而7A2000橋片則進行了升級,並搭配龍芯3A/B5000於2020年下半年問世。



從龍芯的發展歷程看,可以很清晰的看出一條CPU迭代演進和IPC提升的軌跡。龍芯選擇一代提升微結構,一代提升工藝,2012年以前的龍芯3A1000和龍芯3B1500,其IPC為3/G左右(定點),2015年的3A2000是微結構升級,IPC為6.5/G,2016—2017年3A3000是小改微結構後升級工藝,IPC為7+/G,2019年的3A4000是微結構升級,IPC則達到了10+/G。

這種一步一個腳印的發展軌跡,是國內那些宣稱自主研發的ARM CPU所不具備的。那些技術引進的ARM CPU,第一款產品往往是橫空出世,之後IPC多年提升有限,這種現象與其宣稱是完全自主研發、自主可控是存在一定出入的。一些ARM CPU採用先進工藝後,在性能上反而被龍芯用老舊工藝反超,足以說明自主研發雖然道路更加坎坷,但發展後勁更足。
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!