你在說這個新聞嗎?扯!中研院大型語言模型用中國資料集 問AI最高領導人竟答習近平中研院前天宣布自製的繁中大型語言模型登場,被爆使用的資料集,是以中國為主的簡體中文資料、再另外簡轉繁,今天中午下架。立委范雲今天舉例問最高領導人是誰,答案竟然是習近平,她直言這已經是資安問題,是認知戰的議題,要求中研院立刻檢討。立委范雲今天(10/9)晚間於臉書發文表示,中研院前天才宣布自製的繁中大型語言模型登場,今天中午就下架了。因為被發現使用的資料集,是以中國為主的簡體中文資料、再另外簡轉繁。范雲舉例,請它舉例「我國代表性法律」,它回答:「中華人民共和國法典、中華人民共和國憲法」等中國法律,還有其他回答例如:台灣是中國的一部分、國慶是10月1日等,讓她怒轟「實在太離譜,令人憤怒」,這已經是資安問題,是認知戰的議題,出現在最高、理應最嚴謹的學術機構,真的不能接受,她立刻要求中研院盡速出面說明,嚴格檢討!范雲進一步說明,中研院CKIP Lab中文詞知識庫小組,最新開源釋出大型語言模型CKIP-Llama-2-7b,並提供學術和商用,可運用在文案生成、文學創作、問答系統、客服系統、語言翻譯、文字編修、華語教學等;CKIP-Llama-2-7b使用了2個「簡轉繁」後的資料,包括COIG-PC資料集、dolly-15k資料集,前者是由中國AI研究單位為首,包括:北京人工智慧學院、北京大學、香港科技大學等;後者則是以簡中為主的知識問答對話資料集。范雲質疑,台灣想做自己的大型語言模型,為什麼會變成現在這般四不像的樣子?反而出現各種錯誤的、統戰的中共宣傳內容?出如此明顯錯誤的理由是什麼?是預算不足?是資料來源不足?還是什麼?但作為台灣最重要的研究智庫,中研院,怎能如此便宜行事?范雲指出,更重要的是,她會要求台灣能夠有一個我們自己的繁體中文大型語言模型,因為這是AI時代,厚植國力的必要戰備武器!
going_down wrote:台灣之光黃仁勳在台灣...(恕刪) AI其實是軟體設計的一環,而晶片是AI軟體的載體,有說錯請修正塔綠斑們要吹台灣是全世界AI重鎮,倒不如說台灣是AI代工的重鎮請麻煩購淫蕩說說台灣有哪一家AI品牌???就拿無人機來說,無人機就是AI展現的成果,全世界最大品牌無人機製造商就在大陸台灣有嗎??更不用說其他領域的AI對岸都能到月球挖土了,台灣還在吹不曾在台灣讀書的台灣之光
台灣的電動車已經輸中共國挺多的連韓國都比不上了然後台灣有位北城說中共國的解放軍登入台灣會因為沒有google導航而迷路台灣人真是很容易滿足台灣充其量只是產晶片和伺服器最重要的軟體開發輸人家一大截中共國的碼農強台灣一大截看看現在台灣教育市場用的軟體很多也不過就是繁中而已
AI主要還是依託於海量的 網路資料,而整個網路上70%以上的資料使用英文,中文本來就少,對岸更佔據90%以上。使用中文詢問,能夠有正確答案的機率,遠遠小於使用英文。而在中文使用環境下,大部分資料也是由對岸提供,畢竟十四億人口的基數擺在那裡,資料量自然是遠遠大於台灣。