
Google Gemini AI 助理已往不太受人喜好使用, 給人刻板不知變通的形象與其他廠商的 AI 助理大相逕庭, 像是前一陣子的能夠生成吉卜力風格圖片風潮的 OpenAI ChatGPT 成了大家的玩伴, 但隨著代號 Nano Banana 的 Google Gemini 2.5 Flash Image, 產出生動鮮明的人物模型(亦稱公仔)蔚為風潮, 大家把照片裡的人物生成模型照片樂此不疲, 不過能維持多久被其他廠商追上? 或是像 Grok 的虛擬陪伴 Ani 這樣更多的服務成為人類的心靈慰藉?
我平常就常利用 Google Gemini 來產生一些輔助程式, 做程式碼概念驗證或是資料整理, 這次就來試試看 Google Gemini 2.5 Flash Image 公仔照片有什麼有趣之處, 拜前人所賜提供的提示詞, 就能生成品質不錯的模擬圖片, 提示詞範本如:
Create a 1/7 scale commercialized figurine of the characters in the picture, in a realistic style, in a real environment. The figurine is placed on a computer desk. The figurine has a round transparent acrylic base, with no text on the base. The content on the computer screen is the Zbrush modeling process of this figurine.
Next to the computer screen is a packaging box with rounded corner design and a transparent front window, the figure inside is clearly visible.
當然你要用中文也是可以, 從示範提示詞得知要產生1/7比例的模型, 1/7是最常見的人物比例, 成品約在22~23公分之間, 壓克力材質也是常見的模型台座, 不少原型師使用Zbrush建模也是常見的製作過程, 總之, 提示詞的描繪很符合原型師製作模型原型的過程。
測試一: 正面照片


先用最簡單的正面照片試試看, 依樣畫葫蘆般的產生公仔照片
測試二: 側面照片


Nano Banana 會調整生成照片的成品角度, 這點挺厲害的
測試三: 半身照片


不僅調整了角度, 連下半身也自動生成, 而且很符合上半身的迷彩樣式, 站姿也非常符合我原本拍照時的姿勢


真實背景印到了模擬公仔盒子上, 算是有創意, 大腿以下也完美的模擬出來
測試四: 多人照片


修改提示詞指定我要產生左邊人物模型, 也能正確的辨識, 但是提示詞需要各部明確指出, 不然就會產生桌子上是左邊人物, 在盒子裡的是右邊人物的情況


左: 提示詞不夠明確, 盒子內外人物模型錯誤, 右: 修正提示詞後正確產生
測試五: 動物


在不變更提示詞的情況下, 很正常的產生公仔圖


這個測試倒是連貓窩也一起成了模型, 替代了模型台座
測試五: 手繪圖片


圖片來源: X@DAAE, 很完美的呈現原圖的風格, 連模型衣物透明的效果也做了出來
測試六: 模型照片


照片來源: Good Smile Company, 將原本就是模型的照片, 再做成模擬公仔圖, 成效依然不錯
看到 Google Gemini 2.5 Flash Image 生成圖片的突出表現之處, 也許原型師的工作可以少很多? 以上範例是在幾乎沒有變更提示詞的情況產生, 當然也能依照自己的要求產生模擬照片, 提示詞的指示就會需要更加明確!
Google Gemini: https://gemini.google.com/app