午夜精品免费视频,亚洲区欧美区,久久成人精品视频,成人免费网站观看

圍棋的未來(lái)在何方?——人機(jī)大戰(zhàn)對(duì)圍棋文化的影響研討會(huì)

會(huì)議時(shí)間: 2016年2月16日9:00~13:00

主辦單位: 國(guó)學(xué)網(wǎng)、光明日?qǐng)?bào)

參會(huì)嘉賓:林建超(中國(guó)圍棋協(xié)會(huì)副主席)
     邱運(yùn)華(首都師范大學(xué)副校長(zhǎng))
     梁 樞(光明日?qǐng)?bào)國(guó)學(xué)版主編)
     尹小林(首都師范大學(xué)電子文獻(xiàn)研究所所長(zhǎng))
     韓立新(清華大學(xué)哲學(xué)系主任、清華大學(xué)圍棋文化交流與研究基金會(huì)主席)
     孫茂松(清華大學(xué)計(jì)算機(jī)系主任)
     干春松(北京大學(xué)哲學(xué)系教授、儒學(xué)研究院副院長(zhǎng))
     王 元(《圍棋天地》副主編)
     程廣云(首都師范大學(xué)哲學(xué)系主任)
     劉知青(北京郵電大學(xué)軟件學(xué)院教授、圍棋軟件開(kāi)發(fā)者)
     鄧瑞全(北京師范大學(xué)易學(xué)文化研究院副院長(zhǎng))
     方 銘(北京語(yǔ)言大學(xué)孔子與儒家文化研究所所長(zhǎng))

 

尹小林:

  我先介紹一下在座的各位嘉賓。

  林將軍是中國(guó)圍棋協(xié)會(huì)副主席,大家都認(rèn)識(shí),他在《圍棋天地》發(fā)表的《圍棋與國(guó)家》已經(jīng)上了全國(guó)高考語(yǔ)文試卷,是圍棋文化的領(lǐng)頭人。

  邱運(yùn)華老師是首都師范大學(xué)副校長(zhǎng),喜歡圍棋,特別支持圍棋活動(dòng)。

  梁樞先生是《光明日?qǐng)?bào)》國(guó)學(xué)版主編。

  韓立新老師是清華大學(xué)哲學(xué)系教授,也是清華大學(xué)圍棋文化交流與研究基金會(huì)的理事長(zhǎng)。他們已經(jīng)在日本、韓國(guó)搞了一些圍棋文化交流活動(dòng),可能以后還會(huì)在歐洲、美國(guó)搞活動(dòng)。

  干春松老師是北京大學(xué)哲學(xué)系教授,研究領(lǐng)域是中國(guó)哲學(xué)和中國(guó)傳統(tǒng)文化。

  程廣云老師是首都師范大學(xué)哲學(xué)系主任,也愛(ài)好下圍棋。

  方銘老師是北京語(yǔ)言大學(xué)孔子與儒家文化研究所所長(zhǎng)。

  鄧瑞全老師是北京師范大學(xué)中國(guó)易學(xué)文化研究院常務(wù)副院長(zhǎng)。

  劉知青老師是北京郵電大學(xué)軟件學(xué)院教授,這兩天他一直在電視網(wǎng)絡(luò)上講解人機(jī)大賽。他本人就是搞圍棋軟件開(kāi)發(fā)的。

  王元先生是《圍棋天地》的副主編,職業(yè)八段,是在座中圍棋水平最高的。

  孫茂松老師是清華大學(xué)計(jì)算機(jī)系原系主任,現(xiàn)在是書(shū)記。

邱運(yùn)華:

  非常榮幸能夠邀請(qǐng)到各位來(lái)座談,這次我們?nèi)藬?shù)不多,但都是各個(gè)領(lǐng)域的高人。我們前任校長(zhǎng)曾經(jīng)有個(gè)愿望,他說(shuō)我們應(yīng)該辦教職工的圍棋比賽,辦北京市大學(xué)生的圍棋活動(dòng),還應(yīng)該出版一些圍棋古譜,盡量使我們學(xué)校有文化一點(diǎn)。

  今天這個(gè)話題我覺(jué)得特別有意義,這是一個(gè)面向未來(lái)的嶄新話題。原來(lái)國(guó)學(xué)網(wǎng)也主辦過(guò)一些活動(dòng),比如《中國(guó)歷代圍棋古譜集成》,是面向過(guò)去的整理;“國(guó)學(xué)杯”是面向業(yè)余棋界的比賽,等等。而本次座談會(huì)則是面向未來(lái)的一個(gè)活動(dòng),這是非常有意義的。能在這里來(lái)聽(tīng)一聽(tīng)各位的高見(jiàn),我覺(jué)得是非常幸福的一件事情。

尹小林:

  各位嘉賓,我先把這次活動(dòng)的緣起做一個(gè)簡(jiǎn)單陳述,然后大家自由發(fā)言。

  這次人機(jī)大賽的意義,已經(jīng)遠(yuǎn)超主辦方的設(shè)想。記得去年十一月份去韓國(guó)參加圍棋活動(dòng),大家還在討論圍棋軟件,去年在中國(guó)搞了一個(gè)計(jì)算機(jī)圍棋大賽,當(dāng)時(shí)最好的圍棋軟件的水平,職業(yè)棋手要讓五到六個(gè)子,所以許多人認(rèn)為五十年之內(nèi)計(jì)算機(jī)下不過(guò)職業(yè)棋手,甚至有人說(shuō)這輩子都見(jiàn)不到計(jì)算機(jī)在圍棋上戰(zhàn)勝職業(yè)棋手的這一天。今年二月,樊麾戰(zhàn)敗這件事一出來(lái),圍棋界就炸鍋了,樊麾是職業(yè)二段,計(jì)算機(jī)5:0全勝。后來(lái)就是三月李世石與AlphaGo大賽,它的影響已經(jīng)超出了圍棋界,超出了科技界,更大程度上也是一個(gè)文化事件。今天我們這個(gè)會(huì)議的范圍很小,但是有圍棋、科技、文化三個(gè)方面的代表。

  這幾天我看了大賽的棋譜和一些媒體的報(bào)道,有三點(diǎn)感受。

  第一個(gè)感受是強(qiáng)者至上。在圍棋界,誰(shuí)的水平高,誰(shuí)就擁有更多發(fā)言權(quán)。此前計(jì)算機(jī)軟件水平不高,沒(méi)有多少發(fā)言權(quán)。這一次AlphaGo軟件出來(lái)以后,職業(yè)棋手就開(kāi)始謙虛了。

  現(xiàn)在討論比較多的,把計(jì)算機(jī)叫做圍棋上帝。從某種意義上講,計(jì)算機(jī)就是代表上帝和人在下棋,我的第一個(gè)感受就是計(jì)算機(jī)太強(qiáng)大了。

  第二個(gè)感受是大道至簡(jiǎn)。最大的道理是最簡(jiǎn)單的。今天我們還請(qǐng)了《周易》方面的專(zhuān)家,《周易》的“易”與對(duì)弈的“弈”是同音的,在古漢語(yǔ)里面,同音往往同義。當(dāng)圍棋這么復(fù)雜的游戲可以簡(jiǎn)化到用二進(jìn)制來(lái)表述的時(shí)候,它就與《周易》相通了。

  原先我們認(rèn)為圍棋變化太多,無(wú)法計(jì)算,但是當(dāng)我們找到一種算法時(shí),情況就變了。前兩天一個(gè)搞計(jì)算機(jī)的朋友跟我透露了一個(gè)信息,他說(shuō)現(xiàn)在AlphaGo已經(jīng)找到一種基于圖像的算法,直接計(jì)算棋形的面積,計(jì)算雙方棋子的面積。大道至簡(jiǎn),最復(fù)雜的東西用最簡(jiǎn)潔的方法來(lái)表示,這就是計(jì)算機(jī)的基本原理。

  第三個(gè)感受是弱勢(shì)平衡。世界上不能只有強(qiáng)者,弱者是和強(qiáng)者共存共生的。比如王元老師是職業(yè)八段,我是業(yè)余3段,如果他讓到五六個(gè)子的時(shí)候,我們雙方力量就平衡了。實(shí)際上我們的文化也好,圍棋也好,周易也好,中醫(yī)也好,都在講平衡。這次人機(jī)大戰(zhàn)很大程度上是在逼迫我們?nèi)ニ伎細(xì)v史、現(xiàn)代和未來(lái),我們需要從文化的角度上去思考這次人機(jī)大賽的意義。

  我先講這些,拋磚引玉,主要是聽(tīng)大家的發(fā)言。

劉知青:

  上海日?qǐng)?bào)有一個(gè)退休的高級(jí)記者叫胡新梅,曾經(jīng)做過(guò)多年的圍棋報(bào)道。前年的時(shí)候找到我,我寫(xiě)過(guò)一本《現(xiàn)代計(jì)算機(jī)圍棋技術(shù)》,講得其實(shí)就是AlphaGo一些基本方法,還有一些創(chuàng)新放在后面。他看這本書(shū)以后覺(jué)得非常有意思,就說(shuō)我們來(lái)做一個(gè)對(duì)話吧。他是從文化、圍棋的背景,我是在人工智能的背景,這樣做了一個(gè)對(duì)話錄。那本書(shū)里面,我們做了一個(gè)大膽預(yù)測(cè),我說(shuō)計(jì)算機(jī)圍棋會(huì)在五到十五年之內(nèi)戰(zhàn)勝頂尖職業(yè)棋手。這個(gè)可能是當(dāng)時(shí)最大膽的預(yù)測(cè)了,沒(méi)有人相信這個(gè)預(yù)測(cè)。去年十一月份的時(shí)候舉辦首屆計(jì)算機(jī)圍棋錦標(biāo)賽,我們幾個(gè)當(dāng)時(shí)也做了一個(gè)沙龍討論,去預(yù)測(cè)什么時(shí)間能到達(dá)這個(gè)點(diǎn)。普通的研究人員也都是認(rèn)為十五到二十年,那是在去年十一月份。其實(shí)去年十月份AlphaGo已經(jīng)戰(zhàn)勝樊麾了,但當(dāng)時(shí)還沒(méi)有公布,這件事公布是在今年一月二十八日,他們的文章在頂級(jí)科學(xué)雜志《Nature》上發(fā)表,公布了這個(gè)事實(shí)。這遠(yuǎn)遠(yuǎn)超出像我從事這個(gè)行業(yè)的一個(gè)最樂(lè)觀的估計(jì),所謂樂(lè)觀的估計(jì)還是顯得悲觀了,不是五到十五年,而是五到十五個(gè)月已經(jīng)完成這個(gè)事情了,這是科技的一個(gè)重大突破,當(dāng)然它對(duì)圍棋也有一個(gè)深遠(yuǎn)的影響。我想我就先說(shuō)這么多,也請(qǐng)各位教授專(zhuān)家從文化角度更深地去解讀這個(gè)事情。

  首先呢,《Nature》那篇文章非常重要,我仔細(xì)讀過(guò)它,那篇文章指出了一個(gè)很明確的方向,但是它沒(méi)有公布細(xì)節(jié)。細(xì)節(jié)也沒(méi)有辦法公布,如果公布細(xì)節(jié)的話,那就不是十頁(yè)紙,而是要占一百頁(yè)紙了。它不公布細(xì)節(jié),所以別人要復(fù)制那些細(xì)節(jié)還是需要一定的工作量,我們的團(tuán)隊(duì)其實(shí)已經(jīng)開(kāi)始復(fù)制這些技術(shù)當(dāng)然有些細(xì)節(jié),有些參數(shù)都是要重新去摸索,我覺(jué)得田淵棟還需要摸索一些細(xì)節(jié)。要掌握這個(gè)技術(shù),即使公布了方向,就像知道要這樣做才能爬到珠穆朗瑪峰,但你按著方法去爬,也不是十天半月能夠做出來(lái)的東西。

  那么這個(gè)團(tuán)隊(duì),我們可以看到,是非常大的一個(gè)團(tuán)隊(duì)。他們發(fā)表論文就有二十幾位作者,都是長(zhǎng)期從事計(jì)算機(jī)工作的博士專(zhuān)家,最前沿的學(xué)者。可以想象它的工程師團(tuán)隊(duì)人數(shù),乘以二或乘以三都是有可能的。而且他們做了兩年,主要人員都有十多年的計(jì)算機(jī)圍棋研究背景,有十多年的積累。羅馬不是一天建成的,怎么也不可能說(shuō)十五天就可以完成復(fù)制,這是不太現(xiàn)實(shí)的,我不大相信這個(gè)論文一出來(lái),十五天就能夠把它復(fù)制,里面有很多細(xì)節(jié)還需要摸索和積累。

  陰謀論總是有的,但我看他們的論文,非常有說(shuō)服力。而且,世界上能夠這樣戰(zhàn)勝李世石的,應(yīng)該是沒(méi)有的。在現(xiàn)場(chǎng)它不可能去作弊,它下棋的方法也不是人的方法,它做了很多像我們看到的交換,我們看來(lái)都是俗手,這些小細(xì)節(jié)不是最優(yōu),但它仍然可以碾軋李世石。李世石唯一一盤(pán)的翻盤(pán),只是計(jì)算機(jī)在那個(gè)時(shí)候犯了一個(gè)錯(cuò)誤,而這個(gè)錯(cuò)誤其實(shí)是它使用技術(shù)的一個(gè)特征。它使用這種技術(shù),其實(shí)就是有這個(gè)錯(cuò)誤,是算法本身的缺陷,只是說(shuō)平常這個(gè)東西沒(méi)有這么復(fù)雜,沒(méi)有這么大的壓力,沒(méi)有顯現(xiàn)出來(lái)。當(dāng)時(shí)是一個(gè)很復(fù)雜的死活計(jì)算問(wèn)題,計(jì)算機(jī)就把它算錯(cuò)了,這個(gè)弱點(diǎn)恰恰說(shuō)明這是一個(gè)軟件,是一個(gè)計(jì)算機(jī)。而且它的強(qiáng)項(xiàng)也是計(jì)算機(jī)的強(qiáng)項(xiàng),不是人的強(qiáng)項(xiàng)。整個(gè)過(guò)程應(yīng)該還是一個(gè)非常有說(shuō)服力的技術(shù)的展現(xiàn)。

韓立新:

  自從谷歌這個(gè)論文發(fā)表之后,很多人就要去進(jìn)行模擬驗(yàn)證,根據(jù)它提供的突破點(diǎn)去編程,弄出來(lái)的程序都達(dá)到了業(yè)余五六段的水平。這些在過(guò)去都是不可想象的,當(dāng)然我估計(jì)也不是那么簡(jiǎn)單,可能前期也有做過(guò)研究,但是能達(dá)到這個(gè)水平是有可能的,不見(jiàn)得能夠懷疑科學(xué)。

孫茂松:

  五六年前,微軟有一個(gè)華人學(xué)者,是清華出去的,負(fù)責(zé)微軟的語(yǔ)音識(shí)別項(xiàng)目。他是湖南人,兼湖南大學(xué)的教授,當(dāng)時(shí)天河一號(hào)應(yīng)該在湖南大學(xué)放了一套系統(tǒng),他就想做點(diǎn)事情,與我商量說(shuō)能不能做個(gè)圍棋軟件。當(dāng)時(shí)我覺(jué)得圍棋太復(fù)雜了,業(yè)界共識(shí)都一樣,太復(fù)雜了。當(dāng)時(shí)確實(shí)沒(méi)有好辦法,它的搜索空間太大了。我大概算了算,縱橫19道,361點(diǎn),每個(gè)點(diǎn)都有白子、黑子、無(wú)子三種可能,這就是3361。算下來(lái)一盤(pán)棋有10172種可能。

林建超:

  這是沈括在一千年前記載在《夢(mèng)溪筆談》里的,其實(shí)理論上還要比這個(gè)數(shù)字大得多。沈括當(dāng)年不能掌握的,一個(gè)是組合的方法,第二個(gè)是滿(mǎn)空間的算法,第三個(gè)是黑白雙方運(yùn)行,而且他不知道重復(fù)提子,這些東西當(dāng)年都沒(méi)有計(jì)算在內(nèi),所以一個(gè)點(diǎn)不是三種可能,是更多種可能。拿現(xiàn)代的高等數(shù)學(xué)來(lái)計(jì)算,由數(shù)學(xué)博士生導(dǎo)師、計(jì)算機(jī)專(zhuān)家組成一個(gè)組算了三個(gè)月。沈括的那種算法就太簡(jiǎn)單了,那是一千多年前中國(guó)人的智慧,在當(dāng)時(shí)是全世界最高水平。現(xiàn)在來(lái)說(shuō),由于圍棋技術(shù)的發(fā)展和圍棋實(shí)戰(zhàn)經(jīng)驗(yàn)的積累,使大家認(rèn)識(shí)到圍棋里有更多規(guī)律性的東西,所以不是那么簡(jiǎn)單的。

孫茂松:

  反正很復(fù)雜,我算了算這個(gè)復(fù)雜的不得了。而且這里面還有一個(gè)問(wèn)題,你必須把人類(lèi)下得比較好的棋盤(pán)給它送進(jìn)去,做機(jī)器學(xué)習(xí),才有可能。但是中國(guó)大學(xué)里面你要去做這個(gè)工程是很困難的,幾千萬(wàn)棋盤(pán)要送進(jìn)去。所以當(dāng)時(shí)真是沒(méi)有好辦法,大學(xué)沒(méi)有這個(gè)工程能力。谷歌它肯定有這個(gè)工程隊(duì)伍,才能把幾千萬(wàn)個(gè)棋盤(pán)給送進(jìn)去。再一個(gè)國(guó)內(nèi)科學(xué)體制下沒(méi)有辦法拿到這個(gè)經(jīng)費(fèi),做個(gè)圍棋的你給我三千萬(wàn),沒(méi)有結(jié)合國(guó)家重大需求也拿不到。所以當(dāng)時(shí)就沒(méi)敢做。但是到最近兩三年的時(shí)候,卷積神經(jīng)網(wǎng)絡(luò)出來(lái),當(dāng)時(shí)我的第一直覺(jué)就是:圍棋可以做了。因?yàn)榫矸e神經(jīng)網(wǎng)絡(luò)這幾年在語(yǔ)音識(shí)別、圖像識(shí)別上的進(jìn)展是突飛猛進(jìn)。這個(gè)網(wǎng)絡(luò)模型本身很簡(jiǎn)單,稍微講一講可能半個(gè)小時(shí)就搞明白了,但是它的參數(shù)很多。語(yǔ)音識(shí)別現(xiàn)在做到什么程度,它的錯(cuò)誤現(xiàn)在大概在9%,以前要高得多。圖像識(shí)別,現(xiàn)在國(guó)際上有一個(gè)公開(kāi)的圖像識(shí)別比賽,當(dāng)然用計(jì)算機(jī)來(lái)比。大概就是任意給你圖像,你把它分到一千類(lèi)里的一種。人的錯(cuò)誤率大概是5.1%,但機(jī)器大概能做到3.5%。這個(gè)是現(xiàn)在包括谷歌,包括微軟,包括百度在激烈競(jìng)爭(zhēng)的一個(gè)領(lǐng)域,也是用卷積神經(jīng)網(wǎng)絡(luò)。這個(gè)卷積神經(jīng)網(wǎng)絡(luò),就是輸入一張圖片,一個(gè)最簡(jiǎn)單的圖片,64*64的一個(gè)點(diǎn)陣,比圍棋要復(fù)雜的多,圍棋不就是19×19么?而且圍棋就是黑子、白子、無(wú)子三種可能,它不是。

劉知青:

  我再補(bǔ)充一下。如果簡(jiǎn)單的說(shuō)圍棋有多少種狀態(tài),沈括就算出來(lái)了,但圍棋不僅僅是個(gè)狀態(tài),它還是個(gè)過(guò)程,“劫”就是一個(gè)過(guò)程問(wèn)題。當(dāng)你把它看作時(shí)一個(gè)過(guò)程的時(shí)候,復(fù)雜度就遠(yuǎn)遠(yuǎn)超出沈括的計(jì)算了。

孫茂松:

  圖像識(shí)別,機(jī)器來(lái)看,就是一個(gè)格子上面有點(diǎn),點(diǎn)上有黑白,到底是什么東西,機(jī)器也不知道。但我最后要告訴機(jī)器,我要讓機(jī)器說(shuō)出來(lái)這是一個(gè)人、一個(gè)麥克風(fēng)或者一個(gè)杯子,我們叫語(yǔ)義宏構(gòu)化,這個(gè)任務(wù)也含有挑戰(zhàn)性。因?yàn)橐粋€(gè)杯子可以千奇百怪,某種意義上來(lái)說(shuō),這個(gè)任務(wù)可能比圍棋還要難。

韓立新:

  不好意思打斷你一下,是不是說(shuō)在圖像識(shí)別這個(gè)技術(shù)上,人工智能已經(jīng)比人類(lèi)高?

孫茂松:

  對(duì)。別的我不敢講,它這個(gè)是很科學(xué)的考量任務(wù)。把物品分一千類(lèi),然后給一張照片,你可以把它歸到杯子那類(lèi),也可以說(shuō)是別的,給五個(gè)答案去選。這個(gè)條件下,現(xiàn)在機(jī)器做的要比人好。因?yàn)橐磺ь?lèi),有很多東西其實(shí)人可能不認(rèn)識(shí),比如問(wèn)這個(gè)花是什么花,你可能不認(rèn)識(shí),機(jī)器有大數(shù)據(jù)的能力,就會(huì)做的比較好。

  反正不管怎么樣,以前做這類(lèi)任務(wù)都是很差的,像語(yǔ)音識(shí)別,倒退十五年,識(shí)別的準(zhǔn)確率幾乎是零,到現(xiàn)在能做到只有9%的誤差。所以卷積神經(jīng)網(wǎng)絡(luò)這個(gè)東西一出來(lái),這個(gè)模型是一個(gè)通用模型,并不是只針對(duì)某個(gè)任務(wù),拿這個(gè)圖像數(shù)據(jù)去訓(xùn)練,它就能把圖像識(shí)別做好,拿語(yǔ)音的去實(shí)驗(yàn),就能把語(yǔ)音識(shí)別做好,用圍棋數(shù)據(jù)去訓(xùn)練,就能把圍棋做好。

  所以用卷積神經(jīng)網(wǎng)絡(luò)去做策略,這個(gè)算法很簡(jiǎn)單,只要有機(jī)器,跑一下就出來(lái)了。它根據(jù)整個(gè)盤(pán)面去計(jì)算,所以可以掌握所謂的“大勢(shì)”。但這個(gè)大的局面,它自己其實(shí)并不知道,它就是靠算法,最后整個(gè)神經(jīng)網(wǎng)絡(luò)算法,就變成一個(gè)函數(shù)。網(wǎng)絡(luò)本身可能很復(fù)雜,但整個(gè)結(jié)構(gòu)非常非常簡(jiǎn)單。輸出是什么呢?輸出就是下一步棋,你落在哪個(gè)格子里。它就去算這個(gè)概率。剛開(kāi)始所有的參數(shù)都是隨機(jī)給,但當(dāng)前這個(gè)盤(pán)面,黑白這個(gè)是定勢(shì),對(duì)吧?這個(gè)是有的,所有的參數(shù)往上算,算到最后那個(gè)輸出端,然后它去算落在每一個(gè)格上的概率。剛開(kāi)始它不準(zhǔn),靠數(shù)據(jù)去重新反向訓(xùn)練神經(jīng)網(wǎng)絡(luò),最后只要給個(gè)棋盤(pán),我保證下邊落在人類(lèi)專(zhuān)家放的那個(gè)位置的概率是最大。這個(gè)訓(xùn)練很簡(jiǎn)單,但是國(guó)內(nèi)為什么做不了,因?yàn)闆](méi)有那么大的計(jì)算能力,谷歌有這個(gè)能力。這一塊其實(shí)就是機(jī)器學(xué)習(xí)最近若干年發(fā)展的一個(gè)必然趨勢(shì)。

林建超:

  谷歌的硬計(jì)算能力并不領(lǐng)先。在超算能力上,中國(guó)實(shí)際上在十幾年前就拿到了世界冠軍。美國(guó)人現(xiàn)在領(lǐng)先的并不是硬計(jì)算能力。

孫茂松:

  實(shí)際上是機(jī)器學(xué)習(xí)方法理論的突破,如果沒(méi)有機(jī)器學(xué)習(xí)理論上的突破,即使把中國(guó)最強(qiáng)大的計(jì)算機(jī)拿過(guò)來(lái),你在原有的框架來(lái)做,它現(xiàn)在也下不過(guò)四段五段。它這個(gè)搜索能力實(shí)際上是需要在現(xiàn)有的基礎(chǔ)上,比如現(xiàn)在搞個(gè)計(jì)算機(jī),比現(xiàn)有的計(jì)算機(jī)計(jì)算速度快一萬(wàn)倍,也絲毫不解決問(wèn)題

  實(shí)際上算法突破,理論突破是必須的。你看蒙特卡洛搜索,其實(shí)都是這些年的理論貢獻(xiàn),但真正怎么把東西給做出來(lái),這個(gè)事情還是不容易。像FaceBook技術(shù)團(tuán)隊(duì)很強(qiáng)大,它的老板也是做機(jī)器學(xué)習(xí)的幾大巨頭之一,但它就是做不過(guò)谷歌。所以這個(gè)應(yīng)該不存在作弊問(wèn)題,因?yàn)樗@個(gè)模型一旦訓(xùn)練完之后,它在運(yùn)行的時(shí)候,人無(wú)法控制,除非是徹頭徹尾的,赤裸裸的作弊。訓(xùn)練之后,設(shè)計(jì)者都不知道它下一步會(huì)下出什么樣的棋。所以理論上不存在作弊的可能性,而且以谷歌在學(xué)術(shù)上的聲譽(yù),應(yīng)該不會(huì)做這種事。

尹小林:

  我想問(wèn)一下,AlphaGo在每次運(yùn)行時(shí),有沒(méi)有可能調(diào)參數(shù)?比如前三盤(pán)我用100%的運(yùn)算能力,后兩盤(pán)調(diào)到90%或95%,就是一盤(pán)棋下完了以后,下一盤(pán)可以調(diào)整一些參數(shù)來(lái)改變棋力?

劉知青:

  這是完全有可能的。AlphaGo調(diào)參數(shù)來(lái)測(cè)試人的棋力,我覺(jué)得是完全有可能的。其實(shí)它有單機(jī)版,也有分布式版,這兩個(gè)水平不一樣。谷歌把AlphaGo跟李世石的比賽看作是對(duì)其自身技術(shù)的一個(gè)測(cè)試,而不是一個(gè)純粹意義上的比賽。李世石相當(dāng)于AlphaGo的一個(gè)高級(jí)測(cè)試員,主要是去測(cè)試這個(gè)機(jī)器的能力。

孫茂松:

  參數(shù)確實(shí)可以設(shè)。比如蒙特卡洛搜索,原來(lái)采樣是1%,我這回調(diào)的第一點(diǎn),采樣0.1%,速度就快。再一個(gè)它單機(jī)上就可以算了,實(shí)際上是它搜索的能力會(huì)降低。但這個(gè)模型一旦訓(xùn)練出來(lái)之后,基本上就不會(huì)改了。模型也是花了幾個(gè)月好不容易訓(xùn)練出來(lái)的,局部一改,會(huì)變成什么樣完全沒(méi)辦法估計(jì)。

  所以實(shí)際上這個(gè)東西可以做,能做的不錯(cuò),我們可以事先就估計(jì)到,但能做的這么好,確實(shí)沒(méi)有想到。機(jī)器出來(lái)以后,弄個(gè)四段五段,這個(gè)可能性我們覺(jué)得是有的,但是能和人類(lèi)頂尖高手,特別是在整個(gè)布局和局部絞殺那一塊兒,能夠考慮的那么細(xì),這個(gè)我真是沒(méi)有想到。

  另外說(shuō)它有BUG,我認(rèn)為不是BUG的概念。第四盤(pán)輸了,有人就說(shuō)有BUG,其實(shí)是它系統(tǒng)本身在評(píng)估的過(guò)程中就可能出現(xiàn)這個(gè)問(wèn)題。就比如它這個(gè)搜索,隨機(jī)搜索就真的是隨機(jī)搜索。最后在若干步驟里面的正確解好像就只有20%的概率點(diǎn),反正不是100%,它那一塊兒本身就有可能出問(wèn)題。正好遇到靠隨機(jī)搜索搞出的解不是最理想那種狀況,就可能會(huì)出問(wèn)題。

  勾股定理的發(fā)明人畢達(dá)哥拉斯說(shuō):“數(shù)字是宇宙的統(tǒng)治者。”圍棋幾乎沒(méi)有規(guī)則,全是靠計(jì)算,最終結(jié)果全是一組一組的數(shù)。所以AlphaGo輸棋不是BUG,是其模型本身的性質(zhì),可能出昏招,也可能出奇招。搜索空間這么大,人類(lèi)棋手實(shí)際上形成了一種人類(lèi)高級(jí)智慧所確定的搜索范圍,搜索空間大大縮小。而AlphaGo則是全空間搜索,有可能出一些人類(lèi)無(wú)法想像匪夷所思的奇招,有可能觸碰到人類(lèi)慣性思維的盲區(qū),對(duì)我們下棋會(huì)有所啟發(fā)。

  這個(gè)模型除了圍棋,還可以做很多事。比如我的學(xué)生運(yùn)用類(lèi)似模型研發(fā)程序,訓(xùn)練計(jì)算機(jī)作古詩(shī)。試舉一例,上句古人詩(shī)云“江上西風(fēng)一棹歸”,下句計(jì)算機(jī)續(xù)曰“夕陽(yáng)不見(jiàn)客舟低”。再舉一例,上句古人詩(shī)云“又聽(tīng)西風(fēng)墮葉聲”,下句計(jì)算機(jī)續(xù)曰“萬(wàn)事盡隨天籟起”,又續(xù)云“天涯游子不勝情,江山滿(mǎn)眼愁多少,剩有心事緒未成”,意境、平仄、韻律都還不錯(cuò)。這個(gè)古詩(shī)程序是在五十萬(wàn)首古詩(shī)的數(shù)據(jù)基礎(chǔ)上,運(yùn)用回歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network)研發(fā)的。回歸神經(jīng)網(wǎng)絡(luò)適合做語(yǔ)言,而卷積神經(jīng)網(wǎng)絡(luò)適合做圖像。只要提供充分的訓(xùn)練數(shù)據(jù),這些訓(xùn)練數(shù)據(jù)其實(shí)是人類(lèi)知識(shí)的體現(xiàn),加上優(yōu)秀的算法,人工智能?chē)宓乃教嵘潜厝坏摹?/p>

  計(jì)算機(jī)固然可以做很多事,但若讓計(jì)算機(jī)到廚房炒菜,想必就很困難了,因?yàn)榄h(huán)境太過(guò)復(fù)雜。圍棋則相對(duì)簡(jiǎn)潔,棋盤(pán)縱橫十九道,色分黑白,輸入輸出都非常確定,特別適合計(jì)算機(jī)做大量運(yùn)算。歸根結(jié)底,計(jì)算機(jī)體現(xiàn)了人的智慧。

  

Comments are closed.

主站蜘蛛池模板: 湘阴县| 东至县| 南江县| 郯城县| 靖边县| 五大连池市| 叶城县| 麻阳| 南开区| 鹤壁市| 萨嘎县| 屏南县| 类乌齐县| 宾川县| 息烽县| 镇江市| 安远县| 苍南县| 邢台市| 壤塘县| 彭泽县| 新建县| 黑山县| 清新县| 桦南县| 长武县| 永顺县| 高青县| 四川省| 龙陵县| 闻喜县| 淅川县| 靖安县| 嘉义市| 封开县| 广平县| 永康市| 济阳县| 多伦县| 正蓝旗| 增城市|