DeepSeek運營成本衹有ChatGPT的1/100,功能部分超越,而且是免費開源;ChatGPT要每月收費200美元,很快完蛋。看看美國電視台專家訪問。
不怕,你是開源的。
嘿嘿嘿.......



如何看待 DeepSeek 發佈的 MoE 大模型 DeepSeek-V2
2024-05-07 23:53
羅福莉 知乎知識會員
北京深度求索人工智慧基礎技術研究有限公司 員工

今天忙飛,深夜,簡單寫幾點:

1. 單論DeepSeek-V2模型的中文水準(來自20多個微信群用戶反饋),是真實處在國內外閉源模型的第一梯隊(GPT4、文心4.0等),因為沒做RAG(檢索增強)等功能,所以實際在官網(http://www.deepseek.com)的體感可能略微沒那麼驚豔,但這不妨礙API效果呐! 外加1元/百萬輸入Tokens的價格,只有GPT4價格的1/100,性價比之王!

2. 怎麼兼顧模型效果和成本的? 基本純靠:模型結構創新(MLA+DeepSeekMoE)+ 超強Infra。 MLA妙就妙在,它既是 training efficient MQA,也是 inference efficient MHA。 從今天起,放棄MHA/GQA,全面擁抱MLA吧。 同時,不嚴謹來說,DeepSeekMoE也算是開啟了“共用expert+細粒度expert分割”的sparse框架風 -- 完全不同於Mixtral MoE的做法。 簡而言之:創新力就是第一生產力!

3. 我們堅持了一貫樸實無華、真誠直接的開源風格,技術報告、模型權重、vllm推理代碼都開源了: GitHub - deepseek-ai/DeepSeek-V2 希望聚集開源社區智力,加速AGI時代到來。

4. 未來還會持續給大家帶來更驚豔的開源模型(希望有機會可以“明目張膽”的說超過了GPT4-Turbo),所以大家不用擔心模型斷更,也不用擔心API漲價(目前就是大規模服務的價格,不虧本,獲利率超50%)。

5. DeepSeek團隊的每一個人都非常優秀,DeepSeek-V2是群體智慧的結晶,創始人也是我堅信的國內最適合技術驅動型創業的! 以及,最重要的,非常期待同樣對AGI充滿好奇心和創新力的各類人加入(技術&非技術都需要),簡歷投遞郵箱: talent@deepseek.com 或者 加HR微信:DDYWY05。
sroach
原始文章發表於2024-05-07 ! 當年看了這文章而相信或投入deepseek的人真是爽到了[拇指向上]
真便宜,剛翻譯了一整部網略小說,3mb的文本,只收了我3rmb
sroach
如果翻譯金庸小說........ (我好壞心)
BigMac4Diet
有商業頭腦喔......[^++^]
殲二十 wrote:
DeepSe...(恕刪)
希望以後可以有個人可訓練AI,就像專屬寵物.
Deep Seek還不錯用

我在其他帖子説了,這貨其實還是理工向

不純粹是全大語言模型。

問題也是有,最主要的是對話長度不夠

我記得我在來回50次左右,DeepSeek就玩不下去,直接“忘了”我們在談什麽

要重新開始

要重新修正問題,否則同樣情況還會發生。

不過對大部分而言,已經夠了。

我完全是想看看他先累死我還是我先玩死他。

談的是社會問題以及金融問題還有市場問題。
殲二十 wrote:
DeepSeek運營成本衹有ChatGPT的1/100,功能部分超越,而且是免費開源;ChatGPT要每月收費200美元,很快完蛋。看看美國電視台專家訪問。
應該還好吧?她說的是訓練成本很低,不是運作成本很低。
想要使用這些模型,一般人還是要付錢買算力。
至於開源與非開源誰好?
有點像現在的作業系統,
開源的linux安裝與使用已經非常方便,
但是還是很多人付錢用Windows,
而且絕大部分的人也不是免費使用開源軟體。
leeluke168 wrote:
希望以後可以有個人可訓練AI,就像專屬寵物.

希望以後可以買個AGI機器人,
預期應該是MIC的才買得起吧!
今天註冊了,請他幫我規劃初一走廟行程
up2u
這些廟你得騎機車踩點後立馬閃人才有可能全部打卡完
fangri
被你猜中4個小時跑10間廟,提倡環保只有双手合十拜拜
fangri wrote:
今天註冊了,請他幫我規劃初一走廟行程

你是總統府辦公室主任?
sroach
[笑到噴淚]
歡迎截圖使用,看多少人會信
關閉廣告
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!