電腦取代人腦? AlphaGO開發者:人工智慧是中性的 看人類怎麼使用它

在上週之前,若提到人工智慧和人類對決例子,很多人還是會想到1997年打敗西洋棋棋王的「深藍」,但現在,相信更多人會想到「AlphaGO」;上週AlphaGO和世界九段棋王李世乭對戰五場,以四勝一敗的成績得到各界的關注。



在比賽時為AlphaGO下棋的代表,也是AlphaGO主要程式開發者黃士傑博士,今天就現身Google台灣辦公室,跟我們說明AlphaGO是怎麼設計的?為可以贏得比賽?也談談人工智慧為何而生。(這也是小編第一次覺得AlphaGO其實離我們很近。)




AlphaGO來自DeepMind公司


AlphaGO是由位於倫敦的DeepMind公司研發,DeepMind在2010年成立,專攻深度學習、人工智慧的應用,2014年被Google收購,DeepMind成員來自世界各地,很多國家都有,包括4個台灣人,成員也是不同領域的專家,比方神經科學、深度學習領域、類神經網路...等。
▼ DeepMind人工智慧公司共同創辦人暨執行長Demis Hassabis(右)與職業九段棋王李世乭(左)。


黃士傑目前就在DeepMind擔任資深研究員,也是AlphaGO的主要程式開發者。
黃士傑自己也是業餘六段的圍棋棋手,2011年取得師範大學博士學位,論文主題就是「應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法」。
博士班期間(2010年)他研發出的圍棋程式「Erica」,在日本金澤舉辦的第十五屆奧林匹亞電腦遊戲程式競賽中獲得金牌,也是當時世界的最高水平。
黃士傑提到,當時在師大學習到的東西,對後來研發AlphaGO有很大的幫助,也可以說當時的所學,是讓他和團隊可以研究出AlphaGO的基礎。





人工智慧攻破圍棋 提前完成重要里程碑


我們可以看到,很多測試人工智慧的標的,都是挑棋類競賽來進行,從西洋棋到象棋,以及今天的圍棋,這是因為棋局的發展是可預測的,這步棋下了之後,後面會發展出哪些盤面,可能性是抓得出來的,因此人工智慧的研究人員會用棋局來測試人工智慧的運作。



在所有棋局裡,圍棋是最難的。
圍棋的難度之一在它是一個複雜度很高的遊戲,雖然規則簡單,但總共有10的170次方可能的盤面,這個總數是比全宇宙的原子數還多,如果要讓機器知道棋要下在哪裡,就需要考慮到這麼多的變化,但這簡直是個天文數字,所以圍棋被視為是人工智慧演算的大挑戰。
另外一個難處是:它還是個需要直覺的遊戲。
人在下棋時不僅會運用計算能力,還會運用直覺的能力,從經驗裡知道這一步之後棋局會有什麼變化,但電腦沒有直覺,對電腦來說,要學習下圍棋是件很難的事情。

但也正因為圍棋高難度,更讓人工智慧研究者想挑戰,希望能想辦法,運用AI的技術來挑戰圍棋,看能不能得到一些突破跟進展。

黃士傑提到,圍棋對人工智慧研究者來說,一直是個夢魘,因為實在太難了。有一段時間,科學家們一直在想辦法突破,後來到1997年深藍打敗世界棋王後,圍棋就成為僅剩的,人工智慧還無法攻破的棋類遊戲,所以這次的比賽結果,對AlphaGO團隊,或人工智慧界來說,都是一個很大的突破。




AlphaGO獲勝關鍵:深度學習


深藍擊敗棋王至今已快要屆滿20年,這麼久之後,才出現打敗圍棋的機器,關鍵就是深度學習。
西洋棋棋盤上總共有80個點,如果要搜尋有哪些下法的話,會發現第一步有80個點可以下,第二步就有79個點可下....把有多少種可能化成樹狀圖的話,看起來已經很複雜了...


但圍棋的更複雜,圍棋棋盤上有361個點,第一步棋有361個點可以下,第二步有360個點可以下...以一盤棋平均下了150步來算,要電腦找出各種下法,從中判斷最好的那一個,那他會面臨10的360次方種可能,圍棋的樹狀圖比西洋棋複雜得多,如果要讓電腦一一去解析哪種下法最好的話,花上幾億年可能都窮舉不完。


但在加入深度學習後,情況就有了改變。
DeepMind團隊運用「策略網路」(Poicy Network)和「值網路」(Value etwork)兩種神經網路來訓練AlphaGO,演算下在哪裡才是最好的,這也是AlphaGO能打敗職業九段棋王的關鍵。


黃士傑提到,所謂策略網路,是用來幫助AlphaGO減少搜尋廣度的。
AlphaGO利用策略網路去學習什麼狀況下,哪些是最好的前20個棋譜,然後程式只要去分析這20種棋譜就好了。
比方李世乭下了這步棋之後,接下來會有幾百幾千種棋步可以下,但AlphaGO不用一個個去研究,透過策略網路,AlphaGO找出前20種最好的下法是什麼就行了,這就相當於人類下棋時有的那個「直覺」。
在訓練AlphaGO時,需要輸入非常非常多棋譜資料庫,才能學習、預測到什麼是最好的棋譜、對手可能會下在哪裡,所以策略網路是集結了人類好幾千年來的歷史結晶,黃士傑提到,就像棋手繼承了前人的研究成果,來精進棋藝一樣,AlphaGO就是吸取這些前人的成果來學習,所以他不是排除人類的研究成果。

而另一個「值網路」,則是幫助AlphaGO減少搜尋深度。
這個神經網路用來訓練AlphaGO判斷,在目前的棋局下,落子在哪個點會佔優勢(勝率最高)。
比方李世乭和AlphaGO一來一往下了三步棋後,來到一個這樣的棋局,這時候AlphaGO要開始計算之後哪些棋步有優勢,哪些是劣勢,然後直接放棄劣勢的走法。
黃士傑提到,AlphaGO就是透過不斷和自己下棋(AlphaGO對戰AlphaGO),來訓練值網路,一次次從錯誤中學習,也就是所謂的強化式學習法,機器不會累,他可以一直下一直下,這也是AlphaGO的值網路可以這麼強大的關鍵。

利用這兩個網路,AlphaGO已經把對方,以及我該怎麼下的可能性範圍縮小很多,擷取到電腦可以處理的範圍,在保留下來的,機會比較大的盤面下,去演算該怎麼落子,這就是AlphaGO成功的秘訣。


不過我們也知道AlphaGO在第四戰的對決中輸了,李世乭在第四戰下了一手「挖」,被稱為神來一手,但為何在這一步之後AlphaGO形勢往下直到輸掉,團隊還在找原因,黃士傑提到,有可能是bug,也有可能是值網路有誤判,但詳細原因還在研究。


AlphaGO團隊的成員大部分是類神經網路專家,有很多技巧去編寫策略網路跟值網路,訓練AlphaGO,黃士傑在團隊裡負責將搜索的部分做很多優化,整合到整個訓練裡,互相回饋補強。
AlphaGO因為加入這兩個神經網路,搜尋效能被極大提升,才讓在電腦在短時間內就攻破圍棋。黃士傑提到,一開始團隊也做了很多嘗試,才發現用兩種網路來訓練很有效,黃士傑一路看著AlphaGO的進化,也覺得很震撼。
關於AlphaGO如何深度學習,他們之前在科學期刊「Nature」上發表過論文,網路上也有人翻譯成中文了,有興趣的可以去爬爬看。
論文發表後,很多人工智慧的團隊也在學習當中的技巧,黃士傑對此樂觀其成, 他認為人工智慧的研究,會因為更多互相學習,帶領整個領域更進步。





下一步?DeepMind將深度學習應用在醫療上


AlphaGO贏了棋王,是一個很大的成就,但對人類來說,實質的意義在哪?
其實人工智慧/ 深度學習已經應用在很多方面了,比方利用到語音辨識、電腦視覺...的產品,就是深度學習的應用。DeepMind除了研究下圍棋的AlphaGO,另一個團隊也在研究怎麼把深度學習用在醫療上,比方讓機器從大量的病歷資料裡學習,能協助醫生診斷出病患的症狀和原因。
研究人工智慧的終極目標,是要讓世界變得更好,所以之後他們也會把AlphaGO的技術運用到其他地方。

也有人期待AlphaGO之後會不會挑戰星海爭霸、英雄聯盟或五打五團戰遊戲,黃士傑表示這部分公司還在討論,還無法說明,但這種策略遊戲不像棋局有完整的資訊,所以要有不同的學習模式,這方面DeepMind還在研究。




人工智慧是中性的 看人類怎麼使用它


在看完上週人機大戰的新聞後,大家有什麼感想呢?
第一戰由AlphaGO勝出後,網路上出現很多種評論,科技類的新聞多半在解析AlphaGO的運作,或科普人工智慧、深度學習。
人文類的就有很多討論了,其中有很多是電腦是否取代人腦、機器人對人類有什麼影響...之類的正反討論,電影裡也演過,因為機器人太強大,最後統治了人類世界,看來聰明的機器人,並不是人見人愛,有的人對人工智慧還是抱持著恐懼的想法。
在被問到這個問題時,黃士傑表示,DeepMind加入Google之後,成立了一個倫理委員會,專門針對人工智慧的發展會造成的影響,做仔細的評估,在每個案子發展過程中,也會做很審慎的評估跟考量。黃士傑提到,他相信人工智慧是中性的,科技沒有好壞,就看人們怎麼使用它。
小編在其他的報導裡,也看到DeepMind成員有類似的發言,我們不必害怕一個強大的演算法,可怕的是那些利用強大科技為惡的人。

就算電腦聰明過人,但製造出這些機器人的推手,還是人,而且人腦可以處理多工任務,有通用的知識跟想像力可以解決廣泛的問題,這些都是人工智慧還沒辦法做到的,而且要讓人工智慧發展到會主動思考,有自己的意識去解決問題,這很難,目前還在AI初期,透過機器學習逐步發展中,最後會不會演變到那個地步,這不知道,要多久?也無法預測。


後記:
知道AlphaGO開發者裡有位台灣人,可能對很多從事科學的人員或學生有鼓勵作用。
黃士傑是在台灣取得博士學位的,提到自己的心路歷程,他認為台灣的人才素質並不比國外差,只是我們一方面資源少,一方面對自己似乎也缺乏信心。
他在跟國外的研究員一起工作時,會覺得他們的自信心跟企圖心很強,AlphaGO團隊的成員分別來自各個國家,大家都是離鄉背井,但大家都願意在外開拓闖蕩,這種精神跟台灣人比較不一樣,台灣人才其實不弱,但如果能走出去,有信心,跨出那一步,也是可以嶄露頭角的。
這段小鼓勵,也分享給大家。


2016-03-18 22:53 #1

Nanako0625 wrote:
在上週之前,若提到...(恕刪)


Alphago李世石五番棋,實在是非常的精彩,目前youtube上的Deepmind頻道有這五番棋的完整錄影~!

讓人一看再看啊,mobile01有派人去Google台灣總部採訪喔???
過去幾天每一場的 AlphaGo vs 李世石棋局, 我都有觀看, 讓我受益良多. 未來二十年將是深度學習的天下, 而我這一代的 lkk 應該會被淘汰掉. 但是我對人腦的潛能更加有信心, 下一代的人類 (有血肉的) 一定會更強.

這次的 AlphaGo 使用了 1,920 CPUs and 280 GPUs來與李世石對弈. 這個大約是 30個機櫃大小的設備, 儲存了過去只要有數位記錄過的棋譜, 棋局的資訊.

AlphaGo 每一步棋都在做運算, 但是它學習對手的速度, 沒有比李世石學習電腦的棋步來的快. AlphaGo 只是在算下那一步可以佔到最多地盤勝算更高, 而無法預測李世石可能會下哪一步. 反之李世石抓到了這個弱點開始佈局, 這個就是為什麼在前60手李世石就幾乎把他的時間用光而AlphaGo 只用了 40分鐘.

之前三場李世石輸得不冤枉, AlphaGo 也贏的漂亮, 原因在於 AlphaGo 沒有情感, 不感覺讀秒的壓力, 它的設定值是在 xx 秒內做出一個最好的決定. 而李世石今天的佈局非常漂亮, 搶角搶邊後, 破壞掉 AlphaGo 佔領中原的下法, 被譽為神之手的第 78手一點也不為過.

未來舊時代的超級電腦如天河二號, Deep Blue, Watson 等都會被新時代的 AI 類神經的電腦取代掉. 現在不到 25歲想要從事 IT 工作的朋友, AI 的書趕快拿起來吧, 因為以後網管的工作是非常容易被 AI 程式取代的, 它甚至可以在問題發生前就預防了. 它可以透過閱讀新聞, 知道 ransom note 肆虐, 就開始強制升級軟體, 第一時間等待修補漏洞的 patch, 第一時間安裝. 當惡意軟體開始加密, 它也會有強制緊急機制關機中毒的電腦等等.

人類一定會更強, 想想看, 一顆大腦可以比下1,920 CPUs and 280 GPUs的運算, 跟不知大小的數據庫, 當有一天人類發明了心電感應把兩顆大腦串接起來, 你想想, 其運算功能會有多強大, 同時兩顆大腦所需要的能量, 可是比1,920 CPUs and 280 GPUs 少太多了. (心電感應的能力可能會需要類似 Matrix 駭客任務的 Neo 救世主吧, 然後保留那份能力的 dna, 複製到還存活的人類上)

李世石輸了三場才發現電腦弱點, 而 alphago 為了比賽穩定, 所以它現在自我學習的機制是被關閉中, 要等到五場比賽完了以後, 再來做自我檢討學習. 未來如果開啟電腦邊學邊下... 那麼就更加恐怖了

*P.S. 目前 AI 是沒有慾望以及獨立思考意識的, 所以魔鬼終結者的情況還不會出現! 目前的AI如果把它的 power 拔掉, 它是完全不在乎的. 就目前來開 AI 還是無法像是電腦病毒一樣複製以及擴散.
車 Honda Odyssey 手機 Nexus6 筆電 Thinkpad T450s NAS Qnap TS470 pro 平板 Nexus9

EluSiOn wrote:
過去幾天每一場的 AlphaGo...(恕刪)


小弟是圍棋白癡

請問一下,李世石在第四戰勝利後的賽後記者會有提到,希望能在第五戰執黑,希望能以執黑來獲勝

不過照表來看的話,第四戰李世石執白,那第五戰不就本來就要執黑嗎????

你說得很好, 其實李世石還是很強的

我最興奮不是ALPHAGO嬴了李世石, 而是李世石嬴了ALPHAGO一場


至於AI研發, 這是世界上最頂級的科技了, 不是拿書就能使用

那些數學formula, algorithms 是最難的一部份

你看看IBM, 微軟, 百度裡的開發人材都是博士級或頂尖IT人材

我們這平民還是用API或已製好的工具吧


而且, ALPHAGO不是真正的AI, 用圍棋程式來形容他比較合適

真AI的出現最少要在40年之後...(量子電腦?)


EluSiOn wrote:
過去幾天每一場的 AlphaGo vs 李世石棋局, 我都有觀看, 讓我受益良多. 未來二十年將是深度學習的天下, 而我這一代的 lkk 應該會被淘汰掉. 但是我對人腦的潛能更加有信心, 下一代的人類 (有血肉的) 一定會更強.
這次的 AlphaGo 使用了 1,920 CPUs and 280 GPUs來與李世石對弈. 這個大約是 30個機櫃大小的設備, 儲存了過去只要有數位記錄過的棋譜, 棋局的資訊.
AlphaGo 每一步棋都在做運算, 但是它學習對手的速度, 沒有比李世石學習電腦的棋步來的快. AlphaGo 只是在算下那一步可以佔到最多地盤勝算更高, 而無法預測李世石可能會下哪一步. 反之李世石抓到了這個弱點開始佈局, 這個就是為什麼在前60手李世石就幾乎把他的時間用光而AlphaGo 只用了 40分鐘.
之前三場李世石輸得不冤枉, AlphaGo 也贏的漂亮, 原因在於 AlphaGo 沒有情感, 不感覺讀秒的壓力, 它的設定值是在 xx 秒內做出一個最好的決定. 而李世石今天的佈局非常漂亮, 搶角搶邊後, 破壞掉 AlphaGo 佔領中原的下法, 被譽為神之手的第 78手一點也不為過.
未來舊時代的超級電腦如天河二號, Deep Blue, Watson 等都會被新時代的 AI 類神經的電腦取代掉. 現在不到 25歲想要從事 IT 工作的朋友, AI 的書趕快拿起來吧, 因為以後網管的工作是非常容易被 AI 程式取代的, 它甚至可以在問題發生前就預防了. 它可以透過閱讀新聞, 知道 ransom note 肆虐, 就開始強制升級軟體, 第一時間等待修補漏洞的 patch, 第一時間安裝. 當惡意軟體開始加密, 它也會有強制緊急機制關機中毒的電腦等等.
人類一定會更強, 想想看, 一顆大腦可以比下1,920 CPUs and 280 GPUs的運算, 跟不知大小的數據庫, 當有一天人類發明了心電感應把兩顆大腦串接起來, 你想想, 其運算功能會有多強大, 同時兩顆大腦所需要的能量, 可是比1,920 CPUs and 280 GPUs 少太多了. (心電感應的能力可能會需要類似 Matrix 駭客任務的 Neo 救世主吧, 然後保留那份能力的 dna, 複製到還存活的人類上)
李世石輸了三場才發現電腦弱點, 而 alphago 為了比賽穩定, 所以它現在自我學習的機制是被關閉中, 要等到五場比賽完了以後, 再來做自我檢討學習. 未來如果開啟電腦邊學邊下... 那麼就更加恐怖了
*P.S. 目前 AI 是沒有慾望以及獨立思考意識的, 所以魔鬼終結者的情況還不會出現! 目前的AI如果把它的 power 拔掉, 它是完全不在乎的. 就目前來開 AI 還是無法像是電腦病毒一樣複製以及擴散.
對於一個庸才來說、可能不能理解這些天才們到底想做甚麼
但就一個庸才的角度來說、只期望電腦能"專途專用"
協助醫學的、就建置醫療輔助程式來輔助醫護人員
協助建築的、就建置建築工程程式來輔助建築人員
等等....
開發出"能自我學習一切能力"的人工智慧
真的不覺得有多大需求...
我思故我在
人類的知性帶來智慧與文明
倘若開發出"代替人類思考"的機器
那人類的存在意義豈不是被取代?

回歸到阿法勾...
真的看起來比較像"圍棋程式"
isamuchen wrote:
對於一個庸才來說、...(恕刪)


AlphaGo是圍棋程式???
那請問距今約20年前打贏世界西洋棋冠軍的" 藍點 ",又是否只是一個會下西洋棋的程式???

如果照你們的說法,那很多公司下的員工,
說穿也終究也只能是" 人類勞工 ",而並非是什麼所謂" 最富有創造力價值的人類 ",不是嗎???

如果你真的了解google的老本行是做什麼發跡,
那你就應該要知道AlphaGo出席圍棋比賽又要用自家you tube來網路直播的用意在於哪了!

如果要用語言來描述活動的用意與最終目的,
無疑只會讓一群外行人在鍵盤上面大打理論派的筆戰遊戲,
所以與其一個個解釋,還不如直接轉播給大家看...

(雖然黃士傑在google台灣總部的記者會中,就有清楚表明為何要選圍棋比賽的真正用意了...)

另外,同樣是看完5場轉播
南韓政府這邊與朴槿惠已經公開表示要求所有國內企業要砸重金投資這一塊了!

那反觀我們台灣這邊,
大概還在電腦前討論大笑說:AlphaGo充其也只是個圍棋程式而已,根本稱不上是ai吧...

同樣的轉播,
看的懂的,就會知道之後要怎麼去做
看不懂的,就會談笑風生,輕鬆帶過這個自己也不太懂的話題


眼前所發生的一切未必就是真相.因為對方很可能預留了一張checkmate
人類不就是一直發展高科技產物

然後一直在取代人類

誰知道地球頂端那群人對未來是怎麼想的


劍心san wrote:
AlphaGo是圍...(恕刪)


我開宗明義就說、我只是個庸才、確實不懂這些天才們的用意
我的本行也不是理工這一塊、而是社會人文領域
或許真的說"阿法勾是圍棋程式"、幽默不成反而說過頭了
但我是真的對於這種"AI對抗人腦"的做法相當不以為然
我上面也說"人工智慧應該是協助人類"
應該著重在於"協助"
即便想展示"性能"、也應該以"協助"的方式展現
而不是"競技"

其實早十年前的話、我大概還不會有這種想法、也無法理解為什麼有科學家會覺得開發人工智慧是危險的
但這次卻讓我有一點能體會到那些發表"人工智慧是危險的"的人的想法了
我只想知道在中國微薄上放話的那個什麼時候要上場?
限制級
您即將進入之討論頁 需滿18歲 方可瀏覽。
提醒:內容可能因過於寫實、驚悚而令人感到不舒服,是否繼續觀看?

根據「電腦網路內容分級處理辦法」修正條文第六條第三款規定,已於該限制級網頁,依台灣網站分級推廣基金會規定作標示。
評分
複製連結