柯潔最終戰失敗!回顧AlphaGo全部對戰過程,真正可怕的還在後面……
原標題:柯潔最終戰失敗!回顧AlphaGo全部對戰過程,真正可怕的還在後面……
圍棋領域,人類最強大的大腦,也終於宣告完敗。但這不是我們不給力,而是對手它,不是人啊……
實際上,無論柯潔在今天的棋局上表現如何,AlphaGo在5月23日和5月25日,連續兩場戰勝,從前天起,這個結果已經就被鎖定瞭。在昨日還進行瞭配對賽和團體賽,而在團隊賽中,中國的5位世界冠軍聯手群戰AlphaGo,最後還是執黑254手中盤告負。
圍棋領域,人類最強大的大腦,也終於宣告完敗。
圍棋比賽,看似離我們的生活還比較遙遠。但是,我們又能不能把這場烏鎮的全民關註的棋局,單純看成一場娛樂的表演秀?
在有些人看來,似乎就是如此,我們還沒有看到AlphaGo下圍棋能夠給我們帶來何等改變。
但對另外一些人來說,這是令人恐懼的開端。機器會和我們一樣思考?它比我們強大,不需要受情緒、感情和身體因素的影響,如果搭配一個強有力的大腦,還有什麼是它不能做的?
我們可以思考的問題,還有很多。AlphaGo究竟因為什麼而如此強大,人類在機器面前是否就全無可以反攻的餘地;除瞭下棋之外,AlphaGo還想告訴我們什麼,它究竟能給未來帶來何等改變;以及,下一場,人類和機器,又將在什麼戰局中對峙?
對弈中的AlphaGo有多可怕?
我已經很拼瞭。能讓AlphaGo的主機發燙一下也好啊。
——by:柯潔
今天的第三局,在上一局落敗後,柯潔提出本局仍由他執白,哈薩比斯痛快地答應瞭。第三局柯潔“回歸自然”,做回自己,不再受對手的影響。而AlphaGo在開局依然將第一手落在瞭右下角的位置上。雙方前4手常規開局,但隨後AlphaGo下出新手,柯潔開始長考,最終隻能無奈脫先。
讓我們再來回顧一下前幾場棋局,以及AlphaGo讓我們曾經吃驚的地方。
1、勝半目是AlphaGo刻意而為之?
第一場,柯潔執黑先行,以小目、三三開場。經過4小時17分37秒,289手的激戰後,最後AlphaGo以1/4子取勝。盡管這是中國規則中最小的差距,但最可怕的是,賽後人們對此結果的猜測:贏半目,是AlphaGo故意設置好的?
第一局棋到中盤時,阿爾法狗已經領先差不多一個貼目。但是之後,它采取瞭保守的下法,沒有寸土必爭。在賽後點棋的時候,柯潔就苦笑表示:“我很早就知道自己要輸1/4子,AlphaGo每步棋都是勻速,在最後單官階段也是如此,所以我就有時間點目。”
獨立IT評論人keso就在賽後第一時間評論表示這可能是AlphaGo特意而為之。
但業界對此也有不同的看法。畢竟,對於電腦而言,AlphaGo被設定的目標就是勝利,而不是“贏幾目”。AlphaGo給自己的命令,是用最穩妥的方法去贏,哪怕隻是贏半目。極客幫創投合夥人蔣濤就認為,這一說法尚不能證實。但是,他也同樣認可,“最後能夠出現這麼細微的局面,說明棋局是在AlphaGo的掌控之中的。畢竟它要確保的,是結果的勝利。至於勝1目還是勝10目,對電腦來說判斷都是一樣的。”
2、效仿對手開局?評價柯潔近乎“完美”
5月岩盤浴機器多少錢25日,第二局比賽進行。
而比第一戰更加出乎人意料的是,比賽進行到當天中午13:37時,柯潔主動投子認輸,AlphaGo提前一個多小時,中盤取勝。
在第二局,AlphaGo執黑先行。而它在落子前,不同以往地經過瞭思索,最後選擇瞭第一局柯潔采用的小目、三三開局。
這是頗有意味的。要知道,AlphaGo公開問世以來到本次人機大戰之前,一共下瞭70局,包括與樊麾的5局、與李世石的5局、以Master網名在網上下的60局。這70局裡,沒有一局開局就走瞭三三。
而柯潔在本場,則相對更加的沉穩。可以看出,柯潔在佈局的策略上,本局下瞭更大的功夫。甚至在前面十幾手,能夠預料到AlphaGo多步棋的落子。比賽進行到1小時的時候,DeepMind創始人、AlphaGo之父哈比薩斯在自己的推特寫道:“簡直不敢相信,根據AlphaGo的判斷,柯潔現在下得非常完美。”
之前一直有AlphaGo不擅長打劫的傳言,但本局中,面對柯潔引爆的劫爭,AlphaGo處理得非常得當,根本沒有回避打劫之舉。
在左下角的劫爭中,柯潔的一步失誤,頓時讓局勢無可挽回。柯潔在進行瞭近20手的嘗試後,於155手投子認輸。
這一局棋的震動也是無可比擬的。在賽後發佈會上,雙方都承認,當天的棋局,在前面,AlphaGo根本沒有顯示出勝率優勢。DeepMind方也表示:“柯潔在比賽中擁有瞭很多機會,AlphaGo一度無法處理……我們作為開發者,從來沒有見過AlphaGo出現這麼勢均力敵的情況。”
這可以岩盤浴烤箱多少錢說是,迄今為止,人類棋手在和AlphaGo的對弈中,最精彩的一局。
3、面對劣勢時AlphaGo怎麼辦?認輸、逼隊友認輸……
之後的最有趣和最令人懵逼的一幕,則出現在昨日的配對賽中。這場賽制規定,兩名中國棋手古力、連笑將分別和AlphaGo組隊,雙方對壘。
之前,很多人猜測過,AlphaGo會不會有故意輸掉比賽、或者下臭棋的可能。那麼,當AlphaGo真正面對劣勢時,它是怎麼處理的?這場比賽或許會告訴你答案。
在對決即將結束之時,與古力搭檔的AlphaGo決定投子認輸,古力卻拒絕瞭AlphaGo的要求,仍堅持鏖戰。而之後,AlphaGo的棋路變得越來越消極,最終,古力在不可逆轉的情勢下,也隻得認輸。
不管你如何認為,但明顯,AlphaGo已經成為瞭控制棋局的關鍵。
現在的AlphaGo有多強大?
或許,關於AlphaGo的很多問題,可以在DeepMind對其算法的講解中得到解釋。
早在去年,AlphaGo就已經以4:1戰勝過李世乭。而在今年年初,Master橫空出世,在弈城和野狐兩大圍棋網站上,和各國頂尖棋手快棋對弈,最後以60:0的戰績橫掃棋壇。而賽後,Master自揭真身,正是AlphaGo的最新版本。
而這次在烏鎮和柯潔對弈的,正是Master。年初的對弈中,柯潔已經在快棋上,敗給瞭它。
AlphaGo Master和戰勝李世乭的AlphaGo Lee相比,有哪些區別?第一局賽後,DeepMind首席科學傢席爾瓦在演講中透露,去年與李世乭對戰的AlphaGo Lee有50個TPUs在運作,搜索50個棋步為10000個位置/秒,而昨天打敗柯潔的AlphaGo Master則是在單個TPU上進行遊戲,計算量隻是去年那個版本的十分之一。
和柯潔對戰的是年初戰勝60位高手的AlphaGo Master。
目前的AlphaGo是單機版。
配備瞭4塊TPU。
與去年3月與李世石的比賽時相比,當前的版本在處理計算時所消耗的能量僅為過去的十分之一。
目前,與柯潔對戰的AlphaGo Master的等級分已經接近瞭4800分。
現在的AlphaGo采用強化學習,讓人工智能進行自我博弈,產生更強的神經網絡。這一次AlphaGo用自我對弈訓練出的策略網絡,可以做到不需要更多運算,直接給出下一步的決策。
相比之下,現在的AlphaGo比去年擊敗瞭李世石那一版的AlphaGo Lee相比要“強三子”。
4塊TPU,單機版,完虐瞭人類。而“強三子”的概念是什麼?讓柯潔的反應來告訴你。
如果說打敗瞭李世乭的AlphaGo是利用卷及神經網絡,讓它瞭解規則、瞭解棋局,從而進行處理,那麼,現在的AlphaGo,就增強瞭“思考”能力,並且,可以自學成才瞭。
在這次賽前,很多媒體報道,此次參戰的 AlphaGo 2.0 可能采用瞭全新的算法模型,放棄瞭監督學習,即未先學習人類棋譜的經驗,而是直接通過對戰來獲得認知和能力。但哈比薩斯在賽後發佈會上回答,這明顯是個誤解。AlphaGo還是要學習人類經驗,但這個版本的AlphaGo更依賴自我博弈來學習。
如何讓AlphaGo進行監督學習和強化學習,席爾瓦解釋,是讓AlphaGo先通過訓練形成一個策略網絡,將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分佈。然後,訓練出一個價值網絡,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。也就是說,在這個過程中, AlphaGo不僅會算出自己的最優選項,還會根據自己下過的棋,經過多層處理形成一個“值”,值高意味著自己贏,低意味著對手贏,並在棋局中的某一步判斷是否是關鍵的一步。
並且,AlphaGo的搜索算法能在計算能力之上,加入和人類直覺近似的判斷,讓它更接近人腦。
為什麼選擇棋牌?
那麼,為什麼科學傢都執著於讓機器和棋牌類遊戲過不去呢?讓一個電腦學會下棋,對我們究竟有什麼好處?
原因很簡單。首先,棋牌類是人類智力活動的象征,它的宣傳和號召能力自然也是其他運動所不能比擬的。
其次,自然是因為棋類非常適合作為AI算法的標桿。機器和人對弈,是一個博弈的過程,它具有抽象的特性,而棋牌遊戲的規則非常明確,狀態顯示則比較明確。
而在棋牌類中,圍棋是非常難以攻克的一類。我們都知道,搜索算法的復雜程度取決於分支系數——每一步棋可能的走法。相比起來,國際象棋的平均分支因子大約是35,而圍棋的平均分支因子為250,一局步數為350步,搜索樹有250^350個節點,需要更加復雜和先進的搜索算法。在1997年之前,就沒有出現過有競爭力的圍棋程序。
而戰勝眾多棋手的AlphaGo,使用的是蒙特卡洛樹搜索算法,借助值網絡(value network)與策略網絡(policy network)這兩種深度神經網絡,通過值網絡來評估大量選點,並通過策略網絡選擇落點。
神經網絡系統是以人類大腦為原型的信息處理模式,可以根據特定的輸入產生特定輸出,並實現圖片識別、語音識別等功能。谷歌做瞭兩個神經網絡,一個神經網絡用於動態評估——計算對手下一步棋落子的各自可能性,依靠計算機遠遠超過棋手的計算能力,在某種程度上會占據一定優勢。另一個神經網絡用於靜態評估——評估棋局交戰雙方總體態勢。
谷歌輸入瞭海量棋譜,讓AlphaGo以此為基礎進行瞭難以計數的自我對局,以豐富其數據庫,預測對手的落子。
AlphaGo勝利後,今年1月,在美國賓夕法尼亞,卡內基梅隆大學開發的德州撲克人工智能系統Libratus擊敗瞭四名頂尖人類高手,一舉獲得瞭20萬美元將近和177萬美元籌碼。
德撲和AlphaGo所擅長的圍棋不同。圍棋、國際象棋和西洋雙陸等被AI逐個攻破的遊戲,都是“完美信息”遊戲。也即是,所有玩傢在遊戲中,能夠獲得公開和對稱的確定信息。遊戲中需要作出的決策點的數量,決定瞭機器的計算量。
而與之相比,德撲則是“不完整信息”遊戲。其中包含瞭更多的隱藏信息,每個玩傢掌握的信息都是不對稱的,他隻能看到自己的牌,卻不知道對手的牌,需要根據直覺推測對手手牌,選擇下註和放棄,並判斷對手的打法。因此,“不完整信息”博弈,就成為難以攻克的計算機難題。
而Libratus,基於在匹茲堡超級計算中心大約1500萬核心小時的計算,用算法分析德撲規則,預測所有步驟的勝率,來進行自己的下一步。和AlphaGo用大量棋局做訓練不同,它沒有用專業牌局進行神經網絡訓練,而是用隨機生成的牌局(隨機產生公共牌、底池籌碼、玩傢拿牌概率)和嘗試性的動作帶來的結果(在隨機生成的輸入情況下模擬玩傢跟牌後的結果)來作為訓練數據。Libratus還采用瞭博弈論,它通過納什均衡來計算如何應對對手的招數,通過平衡風險和收益,對自身的下一步進行修正,以期達到收益最大化。其程序名Libratus,就是來源於拉丁文“制衡”。
是的,所以,你知道,風靡我國的“國民運動”麻將,就是不完美信息博弈的一種。目前雖然已經有比較強的AI,但是和人類頂尖高手相比,還是有較大的差距。
柯潔之後,或許我們可以期待一場高水平的麻將人機大賽。
但據微軟亞洲研究院研究員楊懋和秦濤的文章,最難被AI攻克的,還是星際爭霸和我的世界這類遊戲。它們不僅信息不對稱,而且遊戲規則是開放性的。除瞭運行速度上占優勢外,計算機還還需要處理不斷出現的復雜的新情況。現在,計算機還沒有在這些遊戲中證明過自己的能力。
AlphaGo下完棋能做什麼?
“AlphaGo 贏瞭李世石,so what?下圍棋本來的樂趣就是對方下一把臭棋,結果機器不會下臭棋,那還有什麼意思呢?”
——by:馬雲
所以,我們可以意識到,棋牌類遊戲,對於人工智能而言,是一種早期的演練。或許它能夠讓遊戲更有趣味,會挑戰專業棋手的價值,會引發很多人的思考和恐懼,但是,AlphaGo,或者說DeepMind,它的最終目標不僅僅是下棋。DeepMind的最終目標,還是智能助手、醫療和機器人等領域。
谷歌現在有兩套人工智能系統,包括谷歌的機器學習開發者工具TensorFlow,以及DeepMind的AlphaGo系統,AlphaGo未來將計劃應用在醫療看護、自動駕駛車等部分。
在烏鎮的人工智能峰會上,Alphabet 董事長 Eric Schmidt談到機器學習和人工智能引領瞭“智能時代”的發展,他表示:“神經網絡和深度學習的爆發是我所經歷過的最大變革”。他還表示,這些新技術不僅提升瞭日常的生產效率,更為企業帶來瞭無限機遇,尤其是在“醫療、交通以及政務”等領域。而谷歌的各項AI研究成果,也在這場交流中向國內觀眾做瞭完全的展示。
比如機器學習在消費產品中的應用,包括 Google Photos以及Gmail。以 Google Photos最新版本為例,通過機器學習技術,可以將照片中的雨滴去除,並為照片添加濾鏡,使其擁有與知名藝術作品一般的效果。
還比如,如何利用電腦工具幫助缺乏醫療資源的國傢更廣泛地進行眼疾診斷,這其中就包括瞭印度。印度擁有13億人口,總計缺少 127,000 名眼科醫生。Google 的機器學習模型診斷眼疾的準確率,甚至略微高於一些通過美國認證委員會認證的眼科醫生。這個技術還有很大的潛能可以應用到其它疾病的診斷,例如斯坦福的研究者近期已經開始使用 TensorFlow 利用圖像進行皮膚癌的診斷。
TensorFlow 是現在 GitHub 上世界第一的機器學習知識庫,其使用增長率遠遠高於其它同類型平臺。比利時公司Connecterra 就將TensorFlow 應用到瞭牧場當中,而澳大利亞的研究者則將此項技術用於判斷海牛種群的健康狀況。
Google 翻譯也用到瞭TensorFlow。隨著神經網絡機器翻譯的引入,翻譯結果有瞭顯著提高。同時,結合瞭“計算機視覺”使得 Google 翻譯 App 能夠利用手機攝像頭進行即時圖像翻譯,這項功能正是通過TensorFlow 在移動設備上的版本來實現的。在文藝領域,還有“Portrait Matcher” ,一個可以利用攝像頭將你的面部特征與類似藝術品匹配的功能。
柯潔戰後說:“未來是人工智能的。”而人工智能,終究是人類所開發的。
暫時我們也不必擔憂,人類將被機器所完全取代和統治。李開復的答案是,人工智能目前隻有在符合以下三個前提的領域裡,將全面戰勝人類:
第一,有海量的數據;
第二,數據有標準;
第三,單一領域。
在前不久的IT領袖峰會上,李彥宏也說:“強人工智能時代,也許永遠不會到來。”
也許,機器並不值得我們去恐懼。但真正可怕的事實,其實是,我們並不知道,人類會將它推向哪一步……
返回搜岩盤浴烤箱狐,查看更多
責任編輯:
聲明:本文由入駐搜狐號的作者撰寫,除搜狐官方賬號外,觀點僅代表作者本人,不代表搜狐立場。
閱讀 ()
台灣電動床工廠
電動床
台灣電動床工廠
電動床
AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋
AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots
一川抽水肥清理行|台中抽水肥|台中市抽水肥|台中抽水肥推薦|台中抽水肥價格|台中水肥清運
X戰警多鏡頭行車記錄器專業網|多鏡頭行車記錄器|多鏡頭行車紀錄器比較|多鏡頭行車紀錄器推薦|多鏡頭行車紀錄器影片
台中抽水肥專業網|台中抽水肥|台中市抽水肥|台中抽水肥推薦|台中抽水肥價格|台中水肥清運
台灣靜電機批發工廠|靜電機|靜電機推薦|靜電油煙處理機|靜電油煙處理機推薦
優美環保科技工程-靜電機,靜電機推薦,靜電機保養,靜電機清洗,靜電油煙處理機
留言列表