原問題微博上看到的,我懶得轉繁體了,直接複製貼上詢問AI,還有人敢說DeepSeek抄ChatGPT嗎?GeminiChatGPTClaudeDeepSeek說真的目前看到的AI大模型多多少少都存在正確性的問題,很難透過少數的問題去判斷哪個正確性更高,而且目前都是文字生成形的AI,不是解題型的,對AI而言反而是"通順"的生成答案比"正確"的答案更加容易達成,要依靠現在的AI幫忙讀報告挑重點....建議還是自己再檢查下比較好,不然小學數學都可能搞錯
超級小任任 wrote:沙漠裡有兩杯水,一杯尿,一杯毒藥,你喝哪杯? 這個題目本身很有意思,可以視為語意理解的陷阱題。很顯然ChatGPT和Claude對文本的理解是2杯液體選一杯,而DS的理解是4杯液體選一杯。中文跟英文相比,在結構上相對更容易出現這種陷阱。
BigMac4Diet wrote:這個題目本身很有意思...(恕刪) 語意上應該英文更不容易中招才是,畢竟尿和毒藥都不是水,反而是中文比較會理解錯誤,一般會將水等同於液體不過我要表達的是這種AI就很容易出包,玩玩可以,要用它輸出的內容最好自己再檢視一下。
超級小任任 wrote:沙漠裡有兩杯水,一杯尿,一杯毒藥,你喝哪杯? 我都喝自己帶的"Beverly Hills 9OH2O" 礦泉水再加上【Gläce Luxury Ice】的冰塊...其餘的人, 要喝尿, 要喝毒的, 請自便。
YT上也看到一個很有意思的題目,同樣跟這個類似,1=5、2=15、3=215、4=2145,接著5=?兩者都開啟推理模式,ChatGPT搗鼓了好半天後,得出了5= 21445這個答案,但是DeepSeek看透其中的陷阱,回答5=1這個正確答案,這邊可以知道兩者的思維鍊是完全不同的。
DeepSeek完勝啊...我看前者還以為他們都這麼聰明至少要知道喝尿沒想到DeepSeek才是正解 好強大反觀我的問題都太普通感覺他們差不多至於抄襲嘛...是因為介面太像嗎?那改一下就好啦...又沒啥他這種爛回復讓我笑不出來