圍棋的未來在何方?——人機大戰對圍棋文化的影響研討會
二
這些天我很難過也很高興地發現,在一個范圍之內,至少在我的朋友圈,持有如我一樣觀點的人,我是唯一一個。
第一,我覺得要向谷歌致敬。因為科學是不同的,在人機對抗之前,在樊麾和AlphaGo比賽之前,有位領導第一時間讓他的秘書發短信問我的看法。我把樊麾和AlphaGo的第一盤棋看完之后,趕緊給他回短信說,我覺得人工智能在時空感和藝術感方面是一個瓶頸。那幾盤棋在我的眼中是一塌糊涂。我為此寫了副對聯:“須知棋訣能變調,不信谷歌就翻天。”現在看來這幅對聯也許有些可笑。經過這次人機大戰,我也算長了見識,之前我完全不信,以為有生之年恐怕難以看到電腦戰勝人腦了。
谷歌的“工”與“功”很了不起。聽說AlphaGo在練習時下一盤棋需要花的電費就是兩百美元,那么它下了幾千萬盤,光是電費就過億美元。如果AlphaGo達不到這種驚世的效果的話,是在暴殄天珍。如今達到了這個效果,我們要向它致敬。
第二,要向李世石致敬。我看他的棋,幾度想流淚。曾記在2008年汶川地震時,李世石和趙漢乘在“亞洲杯”冠亞軍決賽前,決定將比賽獎金全部捐給四川災區。我不記得有其他運動員在國外遇到類似情況時有類似舉動。這次下棋,我覺得李世石有些輕敵了。我當時看樊麾跟AlphaGo下的棋,覺得頂尖棋手讓兩子不夠。沒過多久,李世石說,樊麾和AlphaGo,他都可以讓兩子。從當時棋譜來看,他所說非虛言,而且我很高興跟他判斷一致。
我覺得這次對戰對李世石非常不公平。我覺得李世石是在跟自己下,因為谷歌把所有的棋譜都看完了,經過學習、分析、選擇,變成某種東西,我不認為這是它自己的東西。要和李世石下,可以把李世石所有的棋譜精研一遍。我就想,當時如果是我上去下,電腦不了解我的棋譜,卻以為我就是李世石的話,也許情況就會不一樣。而且時間顯然是不公平的,人和機器同等的時間是不公平的,考慮到機器運算的速度,幾乎可以說,人若用十個小時,機器只要用兩個小時。但這些李世石統統沒有提。李世石下錯了棋后都不說,他是一條漢子。
有了谷歌AlphaGo這面旗幟,以后圍棋文化會發展得越來越好,但AlphaGo并沒有超越人類。它可以和人類共同進步,取長補短,它的存在標志著圍棋文化開了一個新枝。
這幾天,主流輿論認為AlphaGo碾壓、掃蕩李世石。大家都有從眾心理,人工智能攻克的任何一個人類關口,只要不是本行業的人,大家都很高興。所以看棋時,當我說AlphaGo某一步很浮淺、無境界時,我的一位棋友會跟我擺棋爭論,潛意識認為AlphaGo是對的。這是一種文化現象。在AlphaGo以3:0勝李世石時,有位棋友給我發短信,盛贊谷歌圍棋達到的程度之高,我回復說:“是。但我不信。我斷定后兩局李世石至少贏一局,請你為我作證。”
現在大家都在以主流輿論來看待這五盤棋,甚至懷疑第四局是不是放水。其實李世石下這五盤棋的心理是漸變的,由于信息不對稱,在下第一局時,他完全想不到谷歌才半年功夫就已經達到如此水平。初交手時,他故意擺出一個他以為AlphaGo可能沒有見過的陣勢,這是他的戰略失誤。他把AlphaGo當成一個機器,始終想要在合理范圍內下出機器沒有見過的路數,以為這樣勝算更大,此舉差矣,其實他只要把AlphaGo當作一個正常的高手即可。
這五盤對局中,雙方有很多錯著,但連我們的許多職業高手也逐漸開始迷信谷歌,認為AlphaGo一下就是對的。比如第五局,黑棋一上來右下角就被吃了很大一塊,怎么還不見優呢?黑棋第25招,李世石已損失差不多一手棋,后來接近三百招,相當于李世石是讓先在跟AlphaGo下,最后下就差兩目棋。從棋的角度講,AlphaGo雖很偉大,但也沒有那么完美。
李世石下完第一盤后,因出乎意料而倍感緊張,沒想到AlphaGo如此之強。第二盤趨于正常,但雙方都有錯著。第三盤索性放開心態,AlphaGo下錯一著,李世石有機有乘,但可惜他太想節約時間,反而下得過急,導致再次出錯,使本來艱苦的局勢越發窘迫,才有最后悲壯的出招。三盤一輸,我斷定他后兩局必有一贏,因為大比分已定,他可以徹底放開了,所以才有第四局的扳回。但輿論已將AlphaGo看作神。
一個月前,我曾說電腦不可能戰勝人類。現在我要面對現實,把這個說法改成電腦不會超過人類。通看這五盤棋,AlphaGo的棋路很有特點,其形影分別來自三百年前的黃龍士、施襄夏、本因坊道策、本因坊丈和,但更多則來自吳清源,因為它用了許多尖沖,這正是吳清源標志性著法。尖沖的特性,就是增加自己一點點,壓縮對方一點點,而不是斬盡殺絕。還有加藤正夫、李昌鎬、武宮正樹、橋本昌二。
AlphaGo給我們樹立了一個標桿,有此參照物,圍棋成了世界性跨界的文化話題。為此我作了一首七律,題目叫《人機之戰》:
豈料棋風順谷歌,客來問鼎未傳訛。
精靈不外邯鄲步,思想非同磁電波。
正視此時雖落敗,方知往日竟偏頗。
莫將心亂杯弓影,石借他山興爛柯。
這首詩的關鍵詞是“邯鄲步”,喻指學習者的迷失。AlphaGo就仿佛邯鄲學步,學習古今眾多高手,但仍有不到位之處。比如第二局有一斷,是黃龍士的著法,方向正確,可惜選點松緩。
古語講“師夷長技以制夷”,谷歌則是以人制人。李世石其實有些悲哀,因為他有時是在跟自己下棋。他在第四局中的妙手一挖,反映出他的棋力,他最擅長在電光石火的摩擦瞬間見縫插針形成阻斷。AlphaGo會應錯,證明它在計算方面也不過如此。
十年以來,職業圍棋越來越傾向“結果論”,而“結果論”先天性有點阻礙圍棋文化。當今職業棋手不學古人,只求在快棋中贏棋。而AlphaGo卻正是用我們古人的智慧來戰勝了我們。
比賽之前,我曾接受過新浪圍棋記者的采訪,預測人工智能將以3:2或4:1贏李世石。之所以作此猜測,是因為讀了谷歌團隊在《自然》雜志上所發表的論文。如果AlphaGo慘然落敗,被打得一塌糊涂的話,那么他們的科研成果就不過關,豈非自取其辱?雖從個人感情來講,我支持李世石5:0;但從理性科學分析來講,我相信谷歌是有一定把握才讓AlphaGo出戰的。
當第二盤棋李世石輸了之后,我看到很多職業棋手和業余棋迷情緒激動,說李世石不打劫是跟谷歌簽了避劫協議,向全世界作假。我很憤怒,這是完全不可能的事,不應該如此質疑李世石。可以肯定,李世石把這場比賽視作捍衛職業棋界的尊嚴之戰,但他并沒有做好輸棋的準備,整個職業棋界都沒有做好輸棋的準備。
通過這場比賽,人類將面臨一個新時代,即人機對峙的時代。李世石輸棋,確實有準備不足、心理波動等原因,但這也恰恰是人類棋手的共同缺點。
在此想引用國際象棋大師卡斯帕羅夫挑戰“深藍”輸了之后所講的一段非常富有哲理的話:“早期的國際象棋程序有盲點以及一些可以利用的弱點,不禁使人想要去利用,而不是去下堂堂正正的棋。自己跟深藍下的時候就忍不住這樣做了。智力運動,例如國際象棋和圍棋,需要強大的專注力。可是如果老想著去騙電腦,自己的專注力就被破壞了,最后反而會騙了自己,下出疑問手。電腦越強大,這些疑問手就越會被懲罰。”
卡斯帕羅夫發現,在人類一開始跟機器對戰的時候,就會想盡一切辦法尋找機器的盲點和弱點,利用機器的BUG,而不是堂堂正正地去下棋,是利用人類計謀去戰而勝之。卡斯帕羅夫輸棋之后非常痛苦,遂有此反省。李世石在比賽之前,信息確實不對稱,當信息對稱時,他也有可能會想盡辦法利用機器的盲點和弱點,然后利用機器的BUG去戰而勝之。當人類以這樣的心態去面對機器時,結果會如何,這是一個非常深刻的問題。大多數職業棋手在分析AlphaGo時,都是這樣一種利用BUG的心態,比如說認為打劫是AlphaGo的盲點,可以利用打劫戰勝AlphaGo。這場比賽使過去的封閉世界被打開了,勝負觀念由此受到沖擊。
機器說到底是我們人類智慧的結晶,AlphaGo是人類幾千年來關于圍棋的整體智慧的凝結,而李世石只是人類的一個優秀個體。人類的整體智慧戰勝人類的優秀個體,毫不奇怪,但為何人類接受起來卻如此困難。當人類所創造的機器比人類強大,甚至獨立于人類,戰勝人類時,這在哲學上叫做機器的異化。所謂異化,就是指人的創造物反過來獨立于人,強大于人,控制于人。
關于機器的異化,有兩種理解,一種是積極的理解,一種是消極的理解。
費爾巴哈說,上帝的全知全能不過是人類所給予。上帝本來應該是人類的附屬物,但當上帝獨立之后,反過來統治人類。人類應該拒絕異化,反對異化。
黑格爾則說,機器再強大,仍然是人類的本質,是對人類本質的證明,所以人應該積極向機器學習,跟機器一起進步。
當AlphaGo戰勝李世石之后,我認為人類棋手不應該僅僅局限于尋找機器的盲點和弱點,想盡一切辦法要戰而勝之,這有可能陷入一個怪圈,而應該像黑格爾所說向機器學習,跟機器一起進步,以正確態度來面對人機對峙的時代。
中國傳統經典《周易》的一個重要思想就是要求全面地系統地整體看待一切問題。這次人機大戰,李世石無疑是高手,但依舊是人而非神。人類的思維是有共性,有局限的,很難突破自己。AlphaGo的圍棋思維跟人類不同,有似金庸小說中的“無招勝有招”。AlphaGo與李世石是兩種思維方式在對弈,李世石是人類,AlphaGo是機器,它對棋盤、對定式的認識與人類的思維完全不同。AlphaGo是以計算獲取最大實地,從而達到最終勝利為依皈,根本不會考慮定式的問題,而人類則有慣性思維。圍棋棋盤縱橫19道,倘若擴大一倍,人類恐難以掌握其復雜運算,但AlphaGo卻依然可以勝任。
AlphaGo意味著一種質變。人類發展至今,一直在不斷延展我們的四肢,我們的身體,我們的各種機能,但一旦涉及到思維,人類一時就會難以接受。AlphaGo所帶給我們的是思維方式上的變化。圍棋畢竟只是一種游戲,是人類創造的諸多文明中的一種,我們感到難過,恰恰因為我們是人。
《周易》講求動態平衡,正所謂陰陽之謂道。圍棋也講求平衡,每一個子都不是孤立的,是整個棋局中的一環。中國傳統觀念里的五行也講求相生相克,互相制約,也是一種動態平衡。
《周易》里的三易之道,不易、簡易、變易。AlphaGo所追求的也都是最簡潔的下法,計算方式與人類完全不同。
圍棋的未來與AlphaGo發展到什么程度有很大關系,但不會影響圍棋作為人類文化結晶的地位。人類要承認自己的思維有局限性,承認人工智能的發展會改變人類的生活。愛因斯坦的相對論當時就超乎人類的認知。
AlphaGo戰勝李世石,可能后續還會有許多高手與之進行人機大戰。可以斷定,人類以后戰勝機器的可能性會越來越小,國際象棋深藍戰勝卡斯帕羅夫已有印證,圍棋變化雖多,但人工智能發展也會更快。人類正是借助機器使自己的思維變得更強大。但圍棋作為人類文化的結晶,只要有人的存在,圍棋文化的意蘊、審美和給人帶來的愉悅,絕非機器所能替代。
這次約談的主題是“圍棋文化”,不是講圍棋技術,也不是講計算機技術。我覺得現在又進入了“全民談圍棋”的新階段,這次的圍棋熱度剛好趕上了《誰是棋王》和柯潔的勝利,在我有生之年“圍棋熱”這是第二回,第一回是聶衛平中日圍棋擂臺賽。
這個主題會的客觀后果是現在已經有更多的人對圍棋產生興趣,有更多的人加入到下圍棋、看圍棋、學圍棋的熱潮。對于圍棋文化的普及、傳播,以及“圍棋人口”的擴大是一件非常重要的事情。與網易的記者聊天時對方提到,雖然看不懂圍棋,但不談圍棋對任何一個媒體都是一件不能接受的事情。
我也看到了很多關于人工智能的新聞,所以特別贊同鄧老師的觀點。如何定位李世石和AlphaGo,對于“人機大戰”我更贊同“人人大戰”。這個說法給我們提出了一個新的問題,從前人類使用的都是諸如汽車之類的工具,但圍棋軟件涉及到人工智能,現在大家最關心的是人工智能的發展能否突破自我學習的能力。人類比機器強的地方是有大局觀,人類在藝術或時空上是強項,那么從AlphaGo的角度看,機器是否也有大局觀?人類創造的東西能否反過來控制人類、制約人類?
人機對戰的新聞出來后我對柯潔的評論是很失望的,不是他對李世石棋局解釋的失望,而是對他“AlphaGo下得過李世石,但肯定下不過我”這一言論,不能說沒文化,只能說境界比較低。事實上李世石和AlphaGo的人機對戰發展到這個階段,大家關注的不是李世石與柯潔的棋技強弱,而是面對人類科技發展到一定階段的狀態。從棋界的角度要認識到這是整個人類和圍棋的問題,而不是李世石與柯潔誰強。這些天很多棋界的人在媒體上發聲,相比來說我更欣賞李世石的言論。在棋界來說柯潔日前的確很強,但他還需要有大局觀,不是圍棋的大局觀,而是文化意義上的大局觀。
從圍棋評論來看很多人熱衷陰謀論,大家應該理解科技創新的意義。關于百度無辜躺槍,國人的爭論點為什么會集中于宮斗傾向,而不是中國的企業是否應該在科技創新的過程中發揮它的作用,我覺得這是人機大戰的延伸問題。人機大戰本是人工智能與人集中在圍棋文化上的,結果延伸到中國企業或中國網絡企業應該如何科技創新,而不應像百度這么大的企業變成送外賣的公司,谷歌卻在很多科技領域投入了大量的精力。谷歌有那么大的投入推動了科技的進步,而百度在有500億現金的情況下,它有沒有為國人建立起科技文化意識,這是我意想不到的一個聲音。
中國棋界和輿論普遍不能脫離自己本身行業的局限,中國棋界看不到超越于圍棋的事情,我看《忘憂集》上說“功夫在棋外”,要從圍棋來呈現出某一種境界,圍棋文化作為中國文化的一部分,它給中國人培養了一種價值觀。人機大戰在培養價值觀的意義上來說恰好展現了另外一種形式。人機大戰對圍棋文化有很大的影響,它警示圍棋界一定要加強文化素質和境界的提升,不要拘泥于勝負,而是從勝負中體會科技的意義。
圍棋是中國古人智慧的結晶,古人發明了圍棋,首先它是一個游戲,所以圍棋的勝負更應該以輕松、娛樂的心情面對。孔子曰:“不有博弈者乎?為之,猶賢乎已。”下棋有輸有贏,提升了人突破輸贏的境界,非常有利和諧社會的建設,能克服社會中急躁的心。東漢馬融《圍棋賦》里有云“略觀圍棋兮,法于用兵”,這句話一方面講了圍棋是中國古人發明的娛樂工具,可以開發智力,同時又能看到軍事文化、戰爭謀略。因為圍棋有如此意義,所以此次人機大戰受到的關注是想像得到的。谷歌開發的AlphaGo為未來人們的生活提供了很多方便,它為喜歡下圍棋的人們帶來的許多快樂。從這一方面來講它是非常有意義的。
這次人機圍棋比賽是計算機勝利,說明計算機的技術可以克服許多過去我們認為只有人才能解決而不能通過程序解決的問題。
人機大戰中,李世石和AlphaGo,一個代表個體,一個代表多人技術支撐的軟件。古人說“三個臭皮匠頂個諸葛亮”,實際上這不是人機大戰,所謂的人機大戰是人與人共同協作推動科技進步的成功范例。AlphaGo是可以復制的,但李世石卻是不可復制的,所以對普及提高圍棋非常有意義。
圍棋是中國人發明的,AlphaGo對中國文化、中國歷史、中國精神的傳播意義重大,通過電腦可以突破時間、空間的限制,對中國人來講,我們感謝AlphaGo的發明。
但看了關于人機大戰的評論后,我發現社會上存在很多問題。第一是應該克服人類的傲慢意識,認為機器對人類有危險性這是不對的,我們應該樹立謙卑的學習意識、積極擁抱新技術。第二要克服對立意識,加強合作意識,尋求合作空間。第三很多人認為李世石或谷歌做弊,古人云“信者不疑,疑者不信”,不要把人想的過于陰暗,要善意的去理解別人,克服陰暗心理。一切技術都可能有危害性,但更多的是益處。
我很不贊成“大戰”這個說法,它立刻就把人和機器的關系緊張化了,這可能受到了電影的影響,認為人與機器之間必然要發生一場戰爭。人們以前總要在人與機器之間劃一道界線,哲學教科書上一直說,人工智能不等于人類智能,所謂機器思維僅是對思維的模擬。本質主義的思維方式認為“思維是人腦屬性”,這使人們對思維的認識限制在特定的領域。如果這樣考慮問題,人工智能是無法存在和發展的。圖靈在50年代的論文中首次提出機器能夠思維的關點,我們必需突破本質主義思維方式。現在是弱人工智能而不是強人工智能,人腦復雜,所以人們模擬它的功能。我們探討機器思維,不是要機器擁有意識的狀態,而是要人類能做的工作機器同樣能做,這樣機器就等于有思維。不必追究本質,劃一道產格界限,只要某物可以完成另外一樣事物的同樣工作,我們就應該承認,它具有同樣的功能,所以機器是可以思維的。
人與機器的關系暗含了一個假定:一、機器是人;二、人是機器。拉美特里寫過一本書《人是機器》,把人理解為機器,或把機器理解為人,就是要模糊兩者間嚴格的界限。涉及到對人的理解,有人說人如機器被人創造一樣,是被神創造出來的,這種假設是有道理的。這對本質主義思維方式的挑戰很有益處。對人機關系的思考有如下可能:傳統設想為人是主體,機器是人的工具,是客體對象;另一種理解方式為把機器看做與人同樣的主體,這是更為適合未來發展的思維方式。人發明了機器人,不等于人能永遠控制機器人,由于機器人的自我學習能力、自我復制能力,人類最終失去對機器人的控制是完全可能的。許多人擔心機器人代替人,從技術上來講完全可行,就如火車代替馬車。AlphaGo戰勝李世石僅是科技發展階段中的早期的一個標志性的事件。機器人甫一出現就獲得了自我發展的過程,這個發展是一個加速度的發展。機器人一旦進入家庭使用,就如電腦一樣,它的發展速度將會極大的提高。機器與人的關系我們可以把它看成是伙伴關系,機器人與其把它理解為工具或手段,不如把它理解為新的物種,未來人類發展的道路應該是人機合成,人與機器的界限將會進一步的模糊。
圍棋AI是以“數”的方式達到了很高的競技水平,人類則以“道”的方式來理解圍棋,比如“虛實”、“陰陽”、“厚薄”、“輕重”等等,這些二元概念是AI沒有的,是人類獨特的智慧。正因為在圍棋中我們運用了這些抽象的、辯證的思維方式,圍棋的重要價值才顯現出來,否則圍棋就只是一道復雜的數學題了。這些思維方式是人類在面對世界上未知的、無法用“數”達到的事物時的重要路徑,而圍棋的一個重要價值就是能夠幫助我們訓練這樣的思維方式。這有點類似易經的象數和義理。圍棋AI擊敗人類棋手,確實會對競技圍棋產生一定的沖擊,但僅從圍棋技術來看,它能夠幫助人類更好地提高水平,以更接近圍棋的真理。另一方面,圍棋AI讓我們反思圍棋的本質,反思圍棋在競技之外的價值空間,反思人類思維方式的長處和弱點。AlphaGo的出現,對于競技圍棋而言或許是一個驚嘆號,對于圍棋文化而言卻是新階段的開始。