國際時事
2016年3月,人工智慧AlphaGo 打敗世界排名第3的南韓棋士李世乭,雖然出乎各界預料,但勝負戰績懸殊、絕非僥倖。這個難度最高的鬥智競技,人類有可能再度領先嗎?若複雜、抽象且牽涉人性的智能活動,電腦能在一年多時間,靠著自我學習,迅速超越人類累積幾千年的功力,這對圍棋產業意味著什麼?
電競(動)遊戲發達的今天,全球有4千萬人下著堯舜時代流傳下來的圍棋,這個古老遊戲,棋子不分大小且規則簡單,但棋局變化豐富,甚而超越全宇宙的原子種數,最頂尖棋士都無法參透其中奧妙,必須靠著代代承傳來累積對圍棋的認識。可以說,圍棋上的成就,反映著人類智慧的高度⋯⋯直到AlphaGo的出現。
AlphaGo怎麼學下棋?參考下方由研發者DeepMind釋出的人工智慧學習範例,影片是電腦學習電動遊戲《Breakout》,規則有點像打壁球,控制可左右移動的平台、一顆球,去打掉前方的8排磚塊。電腦熟悉規則後持續練習,影片記錄了練習100次、400次、以及600次時,它的破磚技巧,從常常接不到球、零漏接、到開發新技巧──擊出一記可連破好幾塊磚。
電腦一手棋只需5秒鐘,下完一局不到20分鐘,而且能在相同與不同版本間同時開戰,只要不拔掉電源插頭,AlphaGo就是一直玩、一直玩、一直玩、一直玩下去。
跟任何需要透過練習來精通的專業技能一樣,圍棋功力與對戰次數息息相關,與高手對弈次數越多、進步越快,AlphaGo一星期對局數,輕鬆超越頂尖棋士一生比賽次數。因而,截至2015年11月相關論文發表之時,AlphaGo已經累積3千萬次棋局,棋力足以完敗領先的圍棋軟體、歐洲職業圍棋冠軍。
接著今年3月打敗擁有國際賽冠軍次數第二高的南韓棋士李世乭,儘管不乏外界質疑比賽的公平性,但連目前世界排名第一的中國19歲棋士柯潔,賽後都表示,認同 AlphaGo 七成以上棋步決策,也沒有全然把握自己就能贏。
說來尷尬的是,DeepMind 研發的人工智慧,不是為了打敗世界上最聰明的人,而是想找出一體適用的方式,讓電腦能夠從零開始學習任何知識、技術,透過自我學習,持續地調整與改進。人機對弈只是測試這套系統,能否克服公認最難的智力挑戰,AlphaGo變成世界第一圍棋高手,只是順便發生的「意外」,證明它能解決複雜度極高的難題。
震驚、慨嘆更不甘心之餘,忍不住想問,是否能透過比賽規則的調整,讓人類更有匹敵電腦運算能力的公平競爭空間?像是不設對局時限?多人對戰?另若讓AlphaGo來訓練人類,是否有可能青出於藍?
從職業圍棋的角度來看,我國第一位世界圍棋冠軍,目前投身新生代精銳、新銳棋士訓練的紅面棋王周俊勳原先認為,AlphaGo 不能代表電腦圍棋的實際水準(其他電腦圍棋都是程式軟體,非人工智慧),後者尚不足以構成人類威脅,直到近日傳來消息稱,已有其他圍棋軟體打敗頂尖棋士⋯⋯。
以2016年電腦圍棋世界冠軍Zen為例,周俊勳2008年開始受邀與Zen對弈,從讓7顆子開始,幾年來感受到Zen的穩定進步。到今年7月在溫哥華、8月底在東京兩次(單機版)對弈,周俊勳都讓2顆子,第一回贏的輕鬆,第二回差點輸掉。
所以,未來人類要下贏電腦,只能靠拔掉插頭嗎?在人類無法「升級配備」的情況下,是否有更公平、有意義、甚而互利的良性競爭呢?在人機對弈(與其他競爭)的領域裡,人類除了越輸越多、淪為配角,能否化失敗為自我突破的助力?
過去電腦圍棋計算能力強,但不擅長形勢判斷,人類只要避開局部攻殺,掌握大局就能贏棋。AlphoGo 剛好相反,計算錯誤不少,但對全局形勢判斷、佈局觀念,卻優於目前人類最佳水平。一般人視為「臭棋」的爛招、錯誤落子順序,AlphaGo卻能用來打敗李世乭,顛覆了圍棋界固有概念,足以證明它對圍棋的認識已超越人類。
五番棋後,周俊勳也思索,過去以為自己比賽成績不好,是因為天分不夠、努力不足,會不會其實是下棋觀念錯誤?老師長輩們教的,可能只是偷懶、方便(容易贏棋)卻不見得正確的方式,反而限制了其他可能?這樣的反省也影響他的教學,現在糾正年輕棋士「臭棋」時,他態度更加謹慎。
相較於中、日、韓圍棋三大國,圍棋產業在台灣,存在冷熱兩極的奇特現象。台灣圍棋人口號稱有150萬,兒童圍棋尤其盛行。一方面,圍棋對於心算、空間概念、邏輯判斷等智力鍛鍊、專注力與抗壓力的培養,效果非常顯著,下棋的孩子通常功課都不差;另一方面,目前台灣的多元入學制度,多會一項才藝,有助於申請理想高中與大學,所以家長多抱持著鼓勵態度。
學棋需要找人多下,所以民間圍棋活動興盛,每年業餘比賽超過200場,寒暑假幾乎天天都有,上千人參賽稀鬆平常,加上陪同親友,場面非常熱鬧。無論鄉鎮市政府、各級學校、宗教團體、圍棋協會等任何機構主辦,不乏願意出資的贊助商,需要繳交報名費的比賽,還有一定獲利空間。棋力高的業餘選手,每年能拿到6位數字獎金。
多數棋士迫於生計無法專心下棋,自己進步有限、也導致棋士相互磨練強度不足,國際賽更難發揮。惡性循環的情況下,家長或寧可把有天分的孩子,送去日本、中國或韓國發展,或是希望孩子「兼顧」學業,不過,準備職業賽必須全心全意,兼顧學業基本上就顧不好圍棋。
除了發展環境不理想,職業等級的圍棋比賽,並非雅俗共賞的節目,沒有業餘高段以上的棋力,一般人看不懂、也不可能聽得懂講解;意思是,台灣150萬圍棋人口中,可能只有業餘初段以上的2萬多人、1到9級的17萬人,才能體會觀賽的趣味。一旦圍棋已無法代表人類最難智力挑戰,心懷崇敬的關注群眾,是否會逐漸散去?讓追求棋力巔峰的職業圍棋,在台灣加速邊緣化?
同樣長期關注電腦圍棋發展的我國旅日九段棋士王銘琬,對於AlphaGo出現後,圍棋產業可能出現的衝擊與困境,他認為,原因不在於人類再也贏不了電腦,而是圍棋還未發展出完整語言、基本論述,要思考將來與生存問題,圍棋必須先建立自己的語言。
圍棋沒有語言嗎?棋譜、講解或典故,不就是它的語言嗎?王銘琬眼中,現有說明方式,稱不上論述語言。目前,一場圍棋比賽的解說,都是奠基於棋譜的語言,不(太)會下圍棋的人根本聽不懂。
AlphaGo出現以後,完全推翻了過去認定的正確原則,棋譜上各個棋步,出現了與以往完全不同意涵。可以說,AlphaGo切斷了棋譜與傳統詮釋的關連性,王銘琬相信,那會把圍棋推進一個全新的時代。
他解釋,職業棋士制度是歷史的偶然,日本人建立了這個制度,發展的成功吸引其他國家模仿。這種制度下,職業棋士被視為產業金字塔的頂尖,整個產業都在支持他們追求棋力最高境界,連下棋規則,都是為了讓棋力高的人更好發揮,業餘圍棋的目的,也是為了支撐職棋發展。棋士們認為,自己為人類最高智慧而戰鬥,觀賞者也以為,圍棋象徵是人類最高智慧,在AlphaGo出現以前,確實是如此。
「追求最高境界」是圍棋產業的最重要目標嗎?王銘琬強調,圍棋本質在於兩方對弈、交流過程的樂趣,不一定要追求最高境界。台灣業餘圍棋的健壯發展,王銘琬形容是「很偉大的事情」,不必因職棋表現不夠強而自卑。
職棋成績不如中日韓三國,一直是台灣圍棋圈的痛,也讓棋士們處於長期焦慮,自責努力不夠、或還沒培養出更優秀一代,這樣困境王銘琬感同身受,他認為台灣職棋能有目前發展,實在太不容易了,也沒辦法強求,若只以最高境界當目標,就會覺得失敗、做的不夠。
多次拿下本因坊頭銜的王銘琬,一直不認同圍棋界「追求棋力高點」的方向,AlphaGo靠著處理技術,輕易打贏人類,正是產業反思追求目標的最好時機。他打趣說:「你搞了半天,有什麼用?對不對?」他不是說圍棋沒有用,而是意義不一樣了,那不是缺憾,更像是朝正常方向走的契機。
他主張,圍棋產業不該是高塔,應該是主題樂園,可以有挑戰極限的雲霄飛車、也該有不分年齡的旋轉木馬、鬼屋⋯⋯,進去的每個人都可以享受適合自己的樂趣。因此,經營者是否要集結一切資源,拼命增加雲霄飛車的高度?其實這座雲霄飛車、比別的雲霄飛車低一點,一點問題都沒有!(想更了解王銘琬看法,請看其評論《 AlphaGo大勝棋王後 人類的下一步?》)
無論產業應該走哪個方向,圍棋需嘗試建立非全知全能觀點、屬於人的論述語言,讓下棋、不下棋的人能夠更有效溝通,能夠更有效地研究圍棋、釐清圍棋本質與真實價值,並且打破過去隔絕外界的藩籬。王銘琬相信,一旦圍棋有了自己真正的語言,能夠論述、探討所面對的問題,就會更清楚該如何面對困境。
面對電腦威脅的,當然不只有圍棋產業,每隔一陣子,就有評論者發出警告,更多工作要被機器取代了,從生產線作業員、運輸業司機、檔案整理、到收銀出納等,AlphaGo出現後,似乎多數靠腦力過活的知識工作者(白領階級)都飯碗不保。
小時候曾經是備受期待的圍棋神童,目前在國立台北大學金融系任教的施懿宸,同時擁有圍棋與金融的專業,他認為:雖然在圍棋上,人類輸了,但是不代表人工智慧在所有領域皆可以擊敗人類進而取代人類,這還是一個正在探討的議題,還沒有一個完整的答案。
一直以來,圍棋產業金字塔頂端的榮譽與財富,屬於棋力最高的棋士,就像絕大多數產業也把財富與生產效率劃上等號,績效好才有資格要求高報酬。但如今,人類的一切活動,效率皆落後電腦,若不檢討過去的價值與報酬衡量標準,等待著我們的未來,恐怕不容樂觀。
(本文同步刊登於《數理人文》期刊第十期)
用行動支持報導者
獨立的精神,是自由思想的條件。獨立的媒體,才能守護公共領域,讓自由的討論和真相浮現。
在艱困的媒體環境,《報導者》堅持以非營利組織的模式投入公共領域的調查與深度報導。我們透過讀者的贊助支持來營運,不仰賴商業廣告置入,在獨立自主的前提下,穿梭在各項重要公共議題中。
你的支持能幫助《報導者》持續追蹤國內外新聞事件的真相,邀請你加入 3 種支持方案,和我們一起推動這場媒體小革命。