close

決戰AlphaGo:天外有天



掃描二維碼分享到朋友圈

148

周澤雄



谷歌旗下的DeepMind團隊向智力遊戲之王圍棋發起挑戰時,除瞭東亞三國——中國、日本和韓國,全世界人民還是樂觀其成的。在缺乏圍棋傳承和情感寄托的國傢,圍棋之高深莫測隻是一個傳說,一座人類智力的標桿。一旦DeepMind團隊設計的人工智能程序AlphaGo擊敗當代圍棋的頂尖代表李世石九段,那意味著豎起瞭一座新的智力標桿,不待谷歌公司昭告,人類都會意識到:人工智能已經進入瞭一個全新領域。可以想見,接下來計算機科學界和企業界將有大量活計要做,未來世界也將隨之面貌一新。

圍棋之無邊深奧和無窮計算,曾被視為計算機難以攻克的最後一座人類智慧堡壘。AlphaGo出現之前,穩健的估計是,圍棋至少還能在人工智能面前抵抗十年,這是由一系列人機比賽和統計數據支持的結論。僅在半年前,最好的圍棋程序面對職業棋手還得受讓五到六子,差距明顯。關於圍棋復雜性的各種數學描述,同樣可以維持圍棋智力金字塔頂的榮耀。圍棋理論上的變化量,相當於10的170次方,以暴力窮舉著稱的計算機,之前無能為力,而國際象棋、中國象棋等變化量較小的技藝,十幾年前即在暴力窮舉的計算機程序面前俯首稱臣。

今日計算機技術與 1997年IBM“深藍”戰勝國際象棋冠軍卡斯帕羅夫的時期相比,早已不可同日而語,盡管如此,與人類代表李世石九段正面對抗的那臺分佈式版AlphaGo(比單機版更厲害),據說仍動用瞭上萬臺機器(對外宣稱1200個CPU,2000個GPU),比“深藍”的計算力提高瞭三萬倍。更直觀的說法是:比賽期間這些機器僅每天開銷的電費,即達3000美元——一個何其霸道的機器狂魔!想象一下,相當於一支由三艘核動力航空母艦組成的航母編隊,與一艘小舢板進行正面決戰。使對抗成為可能的,是小舢板上那顆不可估量的人類大腦。

圍棋的超級復雜,源於它規則上的超級簡單:每一顆黑白子絕對平等,不存在象棋遊戲裡的等級差,它是一個意在開疆靜電機推薦拓土的帝國遊戲,而非專註頭銜大小的君主遊戲。落在棋盤上的每一枚子,長遠看都包孕著無窮變量,此時此地價值連城的“棋筋”,寥寥數手後也可能淪為精華已盡、可舍可棄的雞肋;甚至,分明功能喪盡的一堆死子,在棋局的某些階段還可能扮演臥底,擔任絕地反擊、收復失地的先鋒:李世石先生賴以成名的絕技“僵屍流”,即是此類場景的形象描述。

圍棋雖是勝負世界,但在不少場合——尤其序盤階段——落在棋盤上的黑白子未必具有非此不可的必然性,它還可能代表瞭棋手的趣向、風格和心情,無法從功利的勝負角度加以評估。另外,圍棋世界的開放性和無限可能性,使它具有縱容天才、善待直覺、慫恿想象的特質,來自大棋士的“神之一手”,常常視對方老謀深算的海量推演為無物,直接扭轉瞭局勢,摘走瞭勝利。李世石與AlphaGo的第四局進行至78手,人類天才即以一招妖魅不可方物的凌空一挖,瞬間讓那臺之前做足大棋士模樣的超級計算機,現出智力原型。

就此而言,職業棋手小覷計算機程序,不見得是一種盲目自負。他們——個別先鋒人士除外——隻是不知道擁有新穎算法的人工智能目前已發展到何種階段,他們堅信計算機不可能擁有人類直覺(這是對的),但不知道計算機可以假裝擁有人類直覺,且足以亂真。後者即所謂圖靈測試,意即:如果電腦能在5分鐘內回答由人類測試者提出的一系列問題,且其超過30%的回答讓測試者誤以為對方是人類,則測試通過。實際上,Al-phaGo在與李世石五番棋較量的第一盤獲勝後,網友中流傳的一個搞笑段子,即說明瞭AlphaGo通過測試:網友猜測,對李世石近年勝率最高的中國等級分第一人柯潔九段(兩人正式交戰成績為柯潔8:2領先,且輸掉的兩盤都在番棋中,不影響最終勝利),藏在DeepMind團隊的機器裡。

三個月前,DeepMind團隊通過發表在頂尖科學刊物《自然》上的論文正式宣佈,一臺名叫AlphaGo的人工智能圍棋程序以5:0的懸殊比分戰勝歐洲圍棋冠軍樊麾二段,整個棋界驚掉瞭下巴。他們意識到,狼終於來瞭。隨後,DeepMind團隊宣佈,2016年3月9日,AlphaGo將向近十年來圍棋世界最優秀的代表、手握14個世界冠軍的韓國大棋士李世石九段進行五番棋挑戰,勝者通吃,將獨攬100萬美元獎金。



如果把AlphaGo向李世石九段下的戰書視為一種好萊塢式的外星人入侵警告,把以李世石為代表的職業棋界視為人類最可信賴和依靠的抵抗力量,類似《復仇者聯盟》裡的“鋼鐵俠”和“美國隊長”,我不得不說,棋界精英在此危機時刻向民眾作出的許諾,是極度魯莽輕率的。假定我們乃是需要他們保護的地球公民,我們等來的已經是一個悲劇。

下轉 34版

上接 33版

一開始是信誓旦旦的拍胸脯,李世石先生率先宣佈,必須五比零獲勝,輸一盤都是失敗。他的聲音並不孤單,幾乎所有職業棋手都站在他一邊,口氣也並不稍遜。雖然,來自計算機科學傢的聲音也漸有耳聞,其中最刺激的一個是:DeepMind團隊通過內部測試,判定李世石毫無機會,將0:5落敗。但這個聲音沒有得到職業圍棋界的正視,他們似乎依舊沉迷於用決心代替思考,用情感代替理智,用過往代替現在,用立場代替決策。

李世石的第一盤失敗瞭,計算機展示瞭出乎人類棋手理解之外的手段(棋手戲稱為“AlphaGo流”或“機器流”),還用一手犀利無比的打入,瞬間抹去李世石的大塊實地。雖然柯潔九段預測到瞭這手打入,但包括李世石在內的大量棋手,顯然沒有料到。職業棋界驚愕莫名,這是歷史性的一天,棋手集體失眠。

第二局李世石又輸瞭,人類棋手未出現明顯錯招,局面一度還相持不下,但AlphaGo顯出高人一等的收束功夫,穩穩擴大戰果。這時出現瞭一個有趣情況:無論AlphaGo下出何等怪異的招法(比如那手在任何圍棋寶典裡都不存在的五路肩沖),職業棋手已不敢輕斥其非。他們開始詫異AlphaGo充滿機油味的全局眼光和悠遠算路,嘗試體會另一種圍棋思維的存在。柯潔九段為瞭向AlphaGo致敬,在擔任解說嘉賓時特地穿上一身隻在正式比賽時才靜電油煙處理機穿的正裝。

第三局,AlphaGo以無可爭議的壓迫式手段,對李世石通盤吊打。圍棋的最高級別是職業九段,李世石的中盤戰鬥力曾被其韓國同行誇譽為“十三段”,而AlphaGo似乎擁有十五段的棋力,以張弛有度的太極綿掌功夫,迫使人類棋手束手無策。李世石黑棋第15手,頂多隻是出擊過早、用力過猛,遠遠談不上惡手或敗招,然此手過後,人類代表竟無可挽回地走向瞭不歸路。(聲明一下,我不認為我對圍棋的微末理解,有資格讓讀者分享,本文中關於具體著手的看法,均來自職業棋手的意見。在五盤棋比賽過程中,我一直在多個視頻網站聽柯潔、古力、陳耀燁等中國頂尖高手作現場講解。“十五段”的說法即得自棋聖聶衛平九段的即興觀感,而“吊打”一說來自世界冠軍唐韋星九段的評價。)

總之,三局過後,棋界黯然神傷,一片肅穆,聶衛平表示“要向阿爾法狗脫帽致敬”,古力九段承認從“機器流”裡學瞭幾手,韓國圍棋王子金志錫九段竟氣餒到認為AlphaGo可以讓自己兩子。之前一直堅信能夠戰勝AlphaGo的柯潔九段(他是當今棋界最有資格說這句話的棋手),也默默調低瞭自己的勝率,而他當晚通過微博向AlphaGo發出的挑戰,明顯帶點悲壯色彩:“來吧!管你是阿法狗還是阿法貓!我柯潔在棋上什麼大風大浪沒見過?讓風暴再來的猛烈點吧!”

第四盤棋,怎麼說呢,在李世石走出疑似棋神附體的78手挖之前,形勢已非。那手挖固然奇妙,本身卻不具有轉敗為勝之力,而更像是誘導犯錯的一手。陳耀燁九段認為,假如AlphaGo的79手應在天元的左一路,李世石未必有後續手段,柯潔也認為這手棋“並不是穩穩成立的”。誰知比賽轉眼進入戲劇化階段,機器出現異常,接連走出不可思議的棋:先是連走死棋(意味著幫助對手擴大並鞏固陣地),繼而又在李世石的白角裡無端送吃一子。雖然瞭不起的柯潔九段90手後即勇氣十足地宣佈“阿爾法狗沒法下瞭”,但另一些職業棋手仍惴惴不安,儼然擁有未來世界“原力”的AlphaGo,使這些訓練有素的棋手暫時失去瞭判斷力,他們擔心機器人正在醞釀一個全殲中央白棋的超級計劃。萬幸,AlphaGo昏手不斷,艱辛備嘗的李世石終於贏回一局,職業棋界歡欣鼓舞,當晚的李世石成瞭韓國人的民族英雄,地球人的蜘蛛俠。盡管,稍稍冷靜下來,誰都會意識到機器隻是出瞭一個bug,而bug總是可以修復的,何況AlphaGo還具有自我學習和自我提高的殊能。

第五局,人類棋手調整心態,打算不計成敗利鈍地再與AlphaGo切磋一盤。序盤階段,在棋盤右下角,在計算機最令人畏懼的局部對殺領域,李世石先生無所畏懼地直面挑戰,以精準強悍的人類計算力,大有斬獲,迫使AlphaGo丟盔棄甲(損失至少10目實地),另辟第二戰場。接著,說不清李世石在哪兒出瞭問題(職業棋手頗多分歧),AlphaGo施施然使出重整河山的魔力,轉眼間已令棋盤非復舊觀。100手過後,本次比賽從未預報有誤的柯潔九段宣佈人類棋手已經無望。

最終比分定格在4:1。DeepMind團隊漏算瞭AlphaGo在第四盤中那個不可理喻的bug,才使人類棋手揀回一盤。五盤過後,中國德高望重的棋聖聶衛平慨然長嘆:“AlphaGo不是厲害,而是太厲害。”他雖然承認李世石本次比賽發揮不佳,但他同時強調,換別人上場,結果也一樣。有趣的是,AlphaGo不時還會犯些低級錯誤(比如盡量回避打劫、不懂得保留變化等等),但其綜合棋力,仍在人類頂尖棋手之上。假以時日,必將一騎絕塵,令人類棋手望塵莫及。

我欽佩聶棋聖勇於自我糾錯的胸懷,因為比賽開始之前,他曾斷言AlphaGo毫無機會,李世石將百分之百獲得勝利。韓國棋院則在比賽結束後,授予AlphaGo名譽九段。



在AlphaGo決戰李世石之際,職業棋手說得最多的一句話是,必須捍衛職業棋手的尊嚴。

何謂尊嚴?盡人事,知天命,存理想,尊嚴自在其中。歸根結底,人隻靜電機能追求屬於人的尊嚴。我們理應排除低於人性的目標,但也不必以神祇自居。

道理原本平凡,沒有人會因為奔跑不如獵豹、計算不及一臺小型計算器就灰心喪氣,人類的天賦理性會告訴每一個人,為這等事發愁,純屬庸人自擾。如果有人發問:你們是否想說,那些早已被電腦軟件擊敗的中國象棋和國際象棋選手,都已失去瞭尊嚴?我相信職業棋手都會堅決否認:我們不是這個意思。——他們的確“不是這個意思”,但又的確誤解瞭“尊嚴”。即使從他們深愛的圍棋角度來看,他們的擔憂亦屬多慮。附帶一說,電腦軟件在象棋領域的地位已經達到這種程度:比賽期間,主辦方必須防止選手中途使用手機或接觸互聯網,否則,棋手可能借如廁之機從手機軟件裡求得脫困仙方。隨著Al-phaGo發威,棋手發現,圍棋賽場距這一步也已不遠。

已故日本名譽棋聖、曾以“前五十手獨步天下”聞名的藤澤秀行九段說過一句名言:“棋道一百,我僅知六七。”超級大棋士吳清源也認為:“與棋神下,我堅持不到50手。”說法是否誇張,無人知曉。但所有職業棋手的內心都有一位圍棋之神(你也可以叫他“圍棋上帝”),他們不知道自己距這名假想中全知全能的上帝到底有多遠——換用棋手術語,就是不知道圍棋之神可以讓自己幾個子。若尊重藤澤先生提供的比例,再結合棋力最高者擁有的等級是職業九段,我們不妨說,假想中的圍棋上帝或有九十九段的棋力。

其實,每位棋手都承認,圍棋的深奧性不可窮盡。於是,就出現瞭兩種尊嚴:一種是關於誰更應該擁有圍棋的最終解釋權,是人還是機器?另一種則純然站在圍棋技藝角度,將最高的榮耀給予那位在實戰中擁有更高勝率的對象,不管該對象是人還是機器。若站在後者角度,前一種尊嚴更像是一種虛榮。所謂虛榮,就是那種即使名不符實也要拼死捍衛的東西,而尊嚴則必須處在恰如其分的位置上。

圍棋世界是勝負世界,頂尖棋手常被稱為“勝負師”,但圍棋作為智力聖杯的精髓,源於對圍棋真理——棋道——的追求,真誠的“求道派”才是勝負師的後盾和基座,拒絕讓亢奮的勝負心擾亂平靜的求道立場的人,才真正代表並捍衛瞭圍棋的尊嚴。

比如,當年明知中日兩國處於敵對狀態,仍執意將中國圍棋神童吳清源帶到日本並善加珍護、培養的瀨越憲作先生等日本友人,就是圍棋求道派的突出代表。即使吳清源不久後將整個日本棋界精英打趴在地,島國上的軍國主義者和民族主義者又在大肆反對,他們仍不改初衷。其實,吳清源先生的超凡棋力之於當年日本棋界,頗類似於今日之AlphaGo,但真誠的求道派除瞭仰慕心中的圍棋之神,無視任何世俗勢力。

再如第四盤獲勝的李世石先生,他明知勝利帶有僥幸成分,明知在現行貼目規則下執白棋相對更有利(他本人執白棋的勝率也更高),但為瞭探索AlphaGo化為高人般的幽邃手段,他向DeepMind團隊的領軍者戴密斯·哈薩比斯先生提議,要求第五盤執黑。職業棋手發現,盡管李世石迫切渴望再得一勝(除瞭名譽,勝利還能帶給他兩萬美元的獲勝獎金),但他並未下出意在誘使AlphaGo再度犯渾的超常規手段,行棋堂堂正正,他寧可心悅誠服地擁抱失敗,也拒絕廉價的勝利。與旁觀者想當然的揣測正好相反,飽嘗失敗的李世石先生,對局過程中始終心懷喜悅,他告訴記者:“這次比賽我就得到瞭快樂。關於對棋的理解,我感到瞭人的創意的局限性。看到AlphaGo的招法,我會想,以前對棋的理解是否是對的呢?”

這才是真正屬於圍棋和圍棋人的高貴,真正的一流棋手,或多或少都有這份高貴,不如此他們無法達成棋界成就。在人間棋手的長廊裡,為棋道嘔心瀝血的故事不勝枚舉,它們每一個都神奇得像傳說,優美得像童話。它們都是真實發生過的。



筆者的生活和文字工作,與圍棋毫無關聯,但職業棋手一直是我最偏愛、最尊重的一個群體。真正的棋手都是謙虛本分的,甚至連經常被誤以為有點輕狂的李世石和中國十九歲天才柯潔也是如此。這不是那種社交禮儀場合下的謙虛,而是來自圍棋本身的饋贈。圍棋無可比擬的奇妙性,容不得輕狂者立足。所以,棋手最常說的一句話是“我看不清楚”。

雖然職業棋手在領教AlphaGo之前的表述有點丟人,但在獲悉Al-phaGo實力之後,他們的表現又是誠摯感人的。這不是一群固執己見、固步自封的人,他們迅速意識到,Alpha-Go的下法將拓寬圍棋的未知領域,使得人類有望進一步接近真實的圍棋之神。

AlphaGo的現有實力,是在輸入海量棋譜的基礎上,再結合AlphaGo獨具的自我對弈功能,紮紮實實獲得的。當然,我們這些外行還聽說瞭“蒙特卡洛樹搜索”、“神經網絡”、“價值網絡”等計算機術語,正是這些計算機人工智能領域的新奇突破,使Al-phaGo如虎添翼。但是,盡管AlphaGo擁有“深度學習”的技能,該深度與擅長“舉一反三”“聞一知十”的人類相比,不是一個概念,其學習方式似乎仍然處於“不行千裡,無以致跬步”的階段。相比AlphaGo的饕餮胃口,人類有記錄在案的職業棋手棋譜,尚不能滿足它的學習需要,AlphaGo成長過程中,雜亂無章地吞食瞭大量來自網絡的業餘棋手對局。這肯定有些不對勁。

DeepMind團隊意識到瞭這個問題,他們做出一個決定:刪除Alpha-Go中所有人類棋譜,讓它從零開始,在不接受人類先入之見的前提下,僅僅通過自我學習,從智慧的源頭掌握並提高棋力。這等於說,AlphaGo計劃回到傳說中的堯舜時代,排除人類思維的“污染”,短時間內復現一個人類前所未聞的圍棋文明。計算機特有的超級計算力(一天自我對弈可達數百萬盤),使這個天方夜譚成為可能。“山中方七日,世上已千年”的悠遠傳說,有望回歸現實。一個從未接受過“金角銀邊草肚皮”“立二拆三”“高手在腹”等人類心經指點的人工智能圍棋程序(到時可能改名BetaGo瞭),會展現出何等不可思議的模樣,對此,連我這等對圍棋略知一二的業餘庸手,也充滿好奇和向往。

棋盤上最具不羈想象力的吳清源大師,晚年時構想瞭21世紀圍棋,一種令尋常職業棋手怔然莫對的“六合圍棋”。吳清源的自傳名就叫“天外有天”,他代替人類,早早向AlphaGo蘊含的未知世界,發出熱切的呼喚。

對此美妙前景,一些更優秀的職業棋手,已然熱淚盈眶。維特根斯坦說過:“智慧沒有激情。但是相比之下,信仰卻是一種激情。”AlphaGo也沒有激情,但真理卻是……棋手的信仰。

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

一川抽水肥清理行|台中抽水肥|台中市抽水肥|台中抽水肥推薦|台中抽水肥價格|台中水肥清運

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 ugi000eq66 的頭像
    ugi000eq66

    阿宏的購買清單

    ugi000eq66 發表在 痞客邦 留言(0) 人氣()