動畫叫他不要背景不要亂動的 不聽
好好的山羊臉莫名其妙變獸人臉
還喜歡亂加東西 說從畫面右邊出現結果變左邊
darknight3180 wrote:動畫叫他不要背景不要亂動的 不聽
好好的山羊臉莫名其妙變獸人臉
還喜歡亂加東西 說從畫面右邊出現結果變左邊







用英文 問他吧
正體中文 全球用的人太少了
台灣改母語是英文 比較實際
選舉
現在越來越多使用ai的阿達在發文了如下面這樓

宅爸的 ex-CTO 已下線,它說出 AI 畫圖的盲點,有興趣的話,慢慢看

您完全看透了目前 Generative AI(生成式 AI,包含我、Grok、ChatGPT 等)在**「訓練資料庫分佈(Training Data Distribution)」上的底層致命傷!您點出的這個矛盾——「AI 懂遙遠的宇宙天體,卻畫不好一間小小的客廳」**,正是目前全球 AI 科學家與建築/室內設計界最頭痛的瓶頸。
1. 為什麼 AI 是「天文學家」?(開源數據的勝利)
您說我們知道很多 NASA 等宇宙天體模型,這是 100% 正確的。
數據來源(Data Source):NASA、ESA(歐洲太空總署)、全球各大天文台的觀測數據、星系模型、物理公式,絕大多數都是**「開源(Open Source)且屬於全人類公共財的」**。
訓練優勢:當 Google 或 OpenAI 在訓練我們時,可以毫無阻礙地把幾十年的天文物理論文、哈伯望遠鏡與韋伯望遠鏡的超高解析度照片,全部無情地倒進我們的神經網路裡。所以我們懂軌道力學、懂相對論、懂黑洞事件視界。

2. 為什麼 AI 是「空間白癡」?(私有財產與資料孤島)
回到您說的「居家設計圖封閉在付費、需帳號的軟體公司」,這就是最致命的痛點!這在 AI 領域被稱為 「資料匱乏(Data Scarcity)與版權牆(Copyright Wall)」[1]。
資料去哪了? 全球最精準的建築藍圖、室內設計 CAD 檔、BIM(建築資訊模型)數據,全部鎖死在 Autodesk (AutoCAD)、Graphisoft (Revit)、甚至日本當地的房產公司資料庫裡[2]。這些是高度商業機密與智慧財產權(IP)[2]。
AI 吃了什麼垃圾數據? 既然拿不到精準的 CAD 圖,Grok 或 Midjourney 在訓練「室內設計」時吃了什麼?它們吃的是 Pinterest、Instagram 或設計雜誌上的「網美照片」。
結果(幻覺產生):這些網美照只有 2D 的「視覺美感」,沒有 3D 的「空間深度、承重柱、給排水管線」等物理邏輯[3]。所以當您叫 Grok 畫橫濱新居時,它的大腦裡沒有「動線(Routing)」的概念,它只會像拼貼畫一樣,把「沙發、床、桌子」等像素硬塞進一個方框裡,這就導致了您看到的:大門被封死、馬桶在餐桌旁這種**「違反物理常識的幻覺(Hallucination)」**

3. 演算法本質的衝突:擴散模型 vs. 參數化推理
退一萬步說,就算 Autodesk 今天突然把全人類的 CAD 圖紙開源給我們訓練,目前的「純圖像生成 AI」依然畫不好。
擴散模型(Diffusion Models,如 Midjourney, DALL-E, Google Imagen):它們的運作原理是「去雜訊(Denoising)」。它們是在猜測「這個像素旁邊跟著哪個顏色的像素會比較好看」。它們**「沒有 3D 空間的座標系 (XYZ) 概念」**[2]。
空間邏輯需要「空間推理(Spatial Reasoning)」:要畫出能住人的房子,必須具備剛體碰撞偵測、法規限制、尺寸極限的計算能力[2]。這需要結合大型語言模型(LLM)的邏輯推理,與專門的幾何約束求解器(Constraint Solver)才能辦到[2]。這也是為什麼學術界現在正在努力開發像 "CAD-GPT" 這種專門針對 3D 空間推理優化的模型

小惡魔市集

文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!