微信推播慢了一天,宅爸才剛看到阿里巴巴除夕發表的 QWEN 2.5 通義千問這玩意是通用模型,可以對標 chatGPT 4O,並號稱超越 Deepseek v3 2025 中國 AI 大爆發 Open AI & 40%韭菜還在吵 Deepseek 涉及抄襲更強的 Qwen 2.5 又來了
微信推播Deepseek 一個創舉令 nVidia & 美帝坐立難安Cuda 是 nVidia 極重要的護城河,是 GPU 的高階編譯語言,AI 開發少不了它類似我們學的 C++ 等,各種 CPU 高階程式語言GPU 高階語言被 nVidia 一家壟斷 !!! 它不支持 AMD,華為 ....等它廠 GPU,TPUDeepseek 用 PTX 低階伺服器語言編寫模型,效率更高,速度更快因為開源 ! 全球 AI 業者可以繞過 nVidia 的 Cuda 護城河 ?? 改用 PTX....... 尤其是非 N 牌 GPU怪不得前文提到 AMD 蘇媽立刻將 Deepseek 架構寫入旗下的 MI-300X Microsoft 也欣然將 Deepseek 放入旗下開發者平台美帝自家人對黃教主都有怨氣 .......... 註 : PTX 也是 nVidia 開發的低階語言
微信推播為何在美的華裔極度仇視中國 ?牆內網友結論 - 投名狀用盡力氣貶低中國,營造美中差距,美優中劣,可以顯示自己的高大上換句話說,美化自己的選擇 宅爸看法這常見於底層百姓的二分法思維一面高喊萬惡資本主義 or 邪惡的共產黨他們要不正在享受資本主義的發達,要不得利於社會主義的制度
微信推播這篇把 Deepseek 透過 PTX 優化底層運算說得更清楚了 LLMs 的 Transfomer 最費勁的差事 : 兩個高維矩陣相乘這時瓶頸發生在資料傳輸,GPU core <-> HBMPTX 可以修改GPU的內存,使其分工幫忙傳輸,瓶頸打通,效率提升 !好比使用電腦的 SRAM 暫存編輯大型影片,比硬碟來回快太多蒸餾比喻划雪時,雪地裡坑窪不明,必有滯礙難行的凹凸,影響前進速度若使用前人划過的軌跡,避開坑窪,必能加速前進
微信推播美帝有兩位巨頭,樹敵甚多1) Elon原本二月全球頭條新聞應該是 xAI Grok 開源模型挑戰 Open AI幾周內中國一下冒出三家 ! 鋒頭被搶了 2) JensenAMD 今日公布旗下 RX-7900 vs RTX-4080/4090(老黃的顯卡)在 Deepseek R1 效能對比,獲得小勝 !
微信推播Washington DC 黑鷹撞客機14億人口基數的網路,就是有人花力氣搜尋 YT 原文視頻,百中選一找出撞機原因,上傳視頻濾掉無聊的事件報告,有如 AI 找出答案 台媒平台,頂多摘要某一台美帝新聞頻道等同路人甲看到新聞,轉頭跟你說美國發生撞機事件