免费高清特黄a大片,九一h片在线免费看,a免费国产一级特黄aa大,国产精品国产主播在线观看,成人精品一区久久久久,一级特黄aa大片,俄罗斯无遮挡一级毛片

分享

AlphaGo只是開頭:深度解析谷歌人工智能計(jì)劃|谷歌|DeepMind

 llvsh 2016-04-04
uuuuuu

打敗了世界圍棋冠軍,這只是萬里長(zhǎng)征的第一步。

加了墊子的墻,昏黃的燈光,花樣墻紙的天花板。這里一點(diǎn)也不像能做出改變世界的尖端發(fā)現(xiàn)。但在這些讓人快要幽閉恐懼癥的模擬走廊里,Demis Hassabis認(rèn)為,他在為創(chuàng)造足以解決人性最大難題的軟件鋪設(shè)道路。

“我們的目標(biāo)很大,”Hassabis說,他冷靜穩(wěn)健的風(fēng)格讓人無法想象他概念的大膽。他在谷歌DeepMind領(lǐng)導(dǎo)一只有200名計(jì)算機(jī)科學(xué)家和神經(jīng)學(xué)家的團(tuán)隊(duì),DeepMind就是在3月初打敗了人類圍棋大師的AlphaGo背后的位于倫敦的團(tuán)隊(duì),創(chuàng)造了計(jì)算機(jī)歷史上的里程碑。

但是,Hassabis說這只是萬里長(zhǎng)征的第一步,作為人工智能領(lǐng)域的阿波羅計(jì)劃,目標(biāo)“解決智能問題,然后用它解決其他所有問題?!比缃衽袛嘀悄苘浖臉?biāo)準(zhǔn)具體到了一個(gè)特定的任務(wù)——面部識(shí)別。Hassabis希望創(chuàng)造他所稱的“綜合智能”——像人類一樣可以學(xué)會(huì)完成任何任務(wù)。他展望未來人工智能可以做各種事情,通過形成和測(cè)試科學(xué)假說推進(jìn)醫(yī)學(xué)發(fā)展,或者用輕巧靈活的機(jī)器人身體跳來跳去。

要實(shí)現(xiàn)這個(gè)目標(biāo),DeepMind的軟件必須超越黑白分明、秩序井然的圍棋世界。它需要掌握亂糟糟的真實(shí)世界——或者從一個(gè)昏暗的、像素化的模擬世界開始。DeepMind的模擬世界叫做Labyrinth,公司在用它讓軟件嘗試非常復(fù)雜的任務(wù),例如在迷宮中導(dǎo)航。這會(huì)推動(dòng)DeepMind研究員鉆研如何制造更智能的軟件,推動(dòng)軟件學(xué)會(huì)面對(duì)更難的決策和問題。他們利用了之前AlphaGo以及DeepMind更早炫耀過的技能,DeepMind學(xué)會(huì)玩二十世紀(jì)八十年代的太空入侵者等復(fù)古Atari游戲,玩得比人類都好。但要成功,Hassabis必須想出辦法,解決人工智能領(lǐng)域中一些年代已久的問題。

自我改善

39歲的Hassabis此生很多時(shí)間都在研究如何創(chuàng)造智能。當(dāng)年象棋神童提早從高中畢業(yè),開始了視頻游戲職業(yè)生涯。后來他獲得了神經(jīng)科學(xué)的博士學(xué)位,發(fā)布了關(guān)于記憶與想象的影響廣泛的論文。

Hassabis在2011年聯(lián)合創(chuàng)建了DeepMind,將他所學(xué)的生物智能轉(zhuǎn)化到機(jī)器。公司在2013年12月發(fā)布了學(xué)會(huì)Atari游戲的軟件,在2014年初被谷歌收購,據(jù)報(bào)道金額達(dá)4億英鎊,當(dāng)時(shí)超過六億美元。DeepMind快速擴(kuò)張,新增雇傭幾十名研究人員,在頂尖機(jī)器學(xué)習(xí)和人工智能會(huì)議發(fā)表大量論文。今年一月,它宣布了AlphaGo的存在,以及AlphaGo在2015年12月打敗了歐洲最強(qiáng)圍棋玩家的消息。本月初,AlphaGo打敗了世界圍棋冠軍李世石。

增強(qiáng)學(xué)習(xí)方法,是讓機(jī)器學(xué)習(xí)軟件學(xué)會(huì)更復(fù)雜任務(wù)的關(guān)鍵。

Atari游戲和圍棋非常不同,但是DeepMind用同樣的方法解決了他們,從動(dòng)物的訓(xùn)練方式中獲得靈感:馴獸師可以用獎(jiǎng)勵(lì)與懲罰教會(huì)動(dòng)物新的招數(shù)。通過被稱為“加強(qiáng)學(xué)習(xí)”的方法,軟件被設(shè)計(jì)為可以探索新的環(huán)境,調(diào)整自己的行為,以獲得某種虛擬獎(jiǎng)勵(lì)。

舉個(gè)例子,DeepMind的Atari軟件被設(shè)計(jì)為只能控制和看見游戲屏幕,具有增加分?jǐn)?shù)的動(dòng)機(jī)。幾個(gè)小時(shí)的訓(xùn)練就可以讓軟件提著鞋帶起身,打到人類專家。

AlphaGo結(jié)合了增強(qiáng)學(xué)習(xí)和其他元素,例如一個(gè)分析幾千萬個(gè)專業(yè)圍棋玩家棋譜從而學(xué)會(huì)評(píng)估不同走法的系統(tǒng),還有一個(gè)搜索機(jī)制來選擇最佳走法。但是,讓AlphaGo能夠打敗世界冠軍的,是與自己練習(xí)幾百萬次的增強(qiáng)學(xué)習(xí)。

Hassabis認(rèn)為,增強(qiáng)學(xué)習(xí)方法是讓機(jī)器學(xué)習(xí)軟件學(xué)會(huì)更復(fù)雜任務(wù)的關(guān)鍵,比軟件現(xiàn)在能玩的要復(fù)雜得多,例如記錄我們的話語、理解圖片的內(nèi)容。“我們不認(rèn)為僅僅觀察就足夠智能,你還必須行動(dòng)。”他說,“最終,這是唯一你可以理解世界的方法?!?/span>

DeepMind的三維環(huán)境Labyrinth,基于一個(gè)開源的第一人稱射擊游戲Quake,專門為驗(yàn)證該想法而設(shè)計(jì)。公司已經(jīng)用它來讓機(jī)器參與游戲,60秒內(nèi)探索隨機(jī)生成的迷宮,收集蘋果或找到出口(可通往另一個(gè)隨機(jī)生成的迷宮)可獲得分?jǐn)?shù)。未來的挑戰(zhàn)可能要去更復(fù)雜的計(jì)劃性——例如,懂得要是可以打開門。公司還會(huì)以其他方式測(cè)試軟件,并在考慮挑戰(zhàn)星際爭(zhēng)霸和撲克牌。但是一段時(shí)期內(nèi),在Labyrinth里設(shè)置越來也難的挑戰(zhàn)將會(huì)是主要的研究方式,Hassabis說,“接下來幾年都?jí)蛴昧恕!?/p>

增強(qiáng)學(xué)習(xí)在未來的二至三年,會(huì)像深度學(xué)習(xí)一樣影響巨大。

其他研究人工智能的公司和研究員會(huì)緊密關(guān)注著。DeepMind增強(qiáng)學(xué)習(xí)的成功讓很多機(jī)器學(xué)習(xí)研究員吃了一驚。這項(xiàng)技術(shù)是二十世紀(jì)八十年代創(chuàng)建的,之前沒有其他訓(xùn)練軟件的方法那么廣泛使用和效果強(qiáng)大,華盛頓大學(xué)研究機(jī)器學(xué)習(xí)的教授Pedro Domingos說。DeepMind加強(qiáng)了這項(xiàng)技術(shù),把它和深度學(xué)習(xí)方法結(jié)合起來。深度學(xué)習(xí)最近有了重大突破,能讓計(jì)算機(jī)解碼圖片等信息,引發(fā)了最近機(jī)器學(xué)習(xí)的熱潮。

“DeepMind所做的很了不起,”Domingos說。但是他還說,Hassabis想做的是一個(gè)超越現(xiàn)在所有研究的火箭,還是后院里放的煙火,現(xiàn)在要下定論還為時(shí)過早——近期讓人眼花繚亂的成功不一定能持續(xù)?!癉emis對(duì)增強(qiáng)學(xué)習(xí)的樂觀態(tài)度不只是處于成功經(jīng)驗(yàn),”Domigos說,“機(jī)器學(xué)習(xí)和人工智能領(lǐng)域中,進(jìn)步不是線性的;我們有時(shí)候會(huì)突飛猛進(jìn),有時(shí)候會(huì)慢慢前行?!?/p>

Hassabis承認(rèn),業(yè)界”很多“人都懷疑增強(qiáng)學(xué)習(xí)的潛能,但是他們不會(huì)買賬。“我們?cè)绞巧钊?,越是感覺我們的理論是正確的,我想我們正在改變整個(gè)領(lǐng)域,”他說?!拔覀冋J(rèn)為增強(qiáng)學(xué)習(xí)在未來的二至三年會(huì)像深度學(xué)習(xí)一樣影響巨大?!?/p>

安全第一

DeepMind的成功目前支持Hassabis關(guān)于增強(qiáng)學(xué)習(xí)會(huì)有很多應(yīng)用的說法。AlphaGo的成功讓很多專業(yè)圍棋手和計(jì)算機(jī)專家驚訝,因?yàn)閲鍖?shí)在非常復(fù)雜,很難讓基本依靠計(jì)算不同走法可能結(jié)果的軟件勝利,也就是1997年IBM的深藍(lán)用來打敗世界象棋冠軍Garry Kasparov的方法。平均來說,象棋玩家每一步有35種可能的走法;在圍棋中,有250種。圍棋中位置可能性排列組合的數(shù)量,比宇宙中原子的數(shù)量都多。“象棋是一種計(jì)算游戲,”Hassabis說,“圍棋太復(fù)雜,所有玩家靠的是直覺。在類別上完全不一樣。你可以把AlphaGo想象成一個(gè)超級(jí)人類的直覺,而非超級(jí)人類的計(jì)算?!?/p>

圍棋世界冠軍李世石回顧他1-4敗于AlphaGo的比賽。圖片來源MIT Technology Review。

圍棋世界冠軍李世石回顧他1-4敗于AlphaGo的比賽。圖片來源MIT Technology Review。

不論你是否同意AlphaGo具有直覺,能讓軟件掌握更復(fù)雜的任務(wù)顯然很有用。DeepMind正在和英國(guó)國(guó)家健康服務(wù)的項(xiàng)目合作,訓(xùn)練軟件幫助醫(yī)務(wù)工作人員發(fā)現(xiàn)腎臟問題的跡象,這些問題經(jīng)常被忽視,并造成大量可以避免的死亡。團(tuán)隊(duì)還在和谷歌業(yè)務(wù)團(tuán)隊(duì)合作,Hassabis說他的技術(shù)可以讓虛擬助理浮現(xiàn),改善推薦系統(tǒng),這對(duì)于YouTube等產(chǎn)品非常重要(類似的系統(tǒng)也是谷歌廣告產(chǎn)品的基礎(chǔ))。

能解決問題的一個(gè)非主流辦法是,學(xué)習(xí)真實(shí)的大腦。

更遠(yuǎn)的未來,DeepMind需要很多突破,才能往Hassabis解決智能的目標(biāo)靠近,即使是未來幾年都在Labyrinth里面試驗(yàn)。最關(guān)鍵的一個(gè)缺口是一種叫做分塊的技能,人類和動(dòng)物的大腦用以處理世界的復(fù)雜性。Hassabis舉了個(gè)去機(jī)場(chǎng)的例子,你可以想好如何去機(jī)場(chǎng)并且完成計(jì)劃,而不用考慮走去門口的時(shí)候每一步走在哪兒,如何轉(zhuǎn)動(dòng)門把手或控制每一個(gè)肌肉纖維。我們可以用高層次的概念來計(jì)劃和行動(dòng),而不用考慮每一個(gè)細(xì)節(jié),并且通過重新組合我們熟悉的“分塊”,或者概念,來適應(yīng)新環(huán)境?!斑@大概是人工智能領(lǐng)域內(nèi)未解決的最核心問題之一?!盚assabis說。

這是許多研究團(tuán)隊(duì)在鉆研的問題,包括其他谷歌團(tuán)隊(duì)。但是,DeepMind希望能解決問題的一個(gè)非主流辦法是,學(xué)習(xí)真實(shí)的大腦。公司有一個(gè)由著名研究員Mattew Botvinick領(lǐng)導(dǎo)的神經(jīng)科學(xué)家團(tuán)隊(duì),他直到最近一直是普林斯頓大學(xué)的教授。與大部分神經(jīng)科學(xué)研究不同的是,他們不僅要研究大腦如何運(yùn)作,還要告訴DeepMind如何設(shè)計(jì)軟件。

有一個(gè)近期試驗(yàn)測(cè)試了Hassabis關(guān)于人腦如何組織概念的理論,利用一個(gè)偽造記憶的標(biāo)準(zhǔn)程序。它給測(cè)試對(duì)象呈現(xiàn)一系列相關(guān)詞,例如“冷”、“雪”和“冰”。人們經(jīng)常錯(cuò)誤地記得聽到一些其他相關(guān)詞,例如”冬天“。

3月,AlphaGo與李世石的比賽進(jìn)行中的DeepMind員工。via MIT Technology Review。

3月,AlphaGo與李世石的比賽進(jìn)行中的DeepMind員工。via MIT Technology Review。

“根據(jù)我的機(jī)器學(xué)習(xí)概念,我想這一定暗示了那種概念信息如何在大腦中組織,“Hassabis說。DeepMind團(tuán)隊(duì)研究出一個(gè)大腦的顳葉前部如何組織概念的理論, 通過觀察正在進(jìn)行記憶任務(wù)的人的大腦,確認(rèn)了理論的假說。這項(xiàng)結(jié)果可能會(huì)改變DeepMind設(shè)計(jì)人工神經(jīng)網(wǎng)絡(luò)來呈現(xiàn)信息的方式。

DeepMind的”待發(fā)現(xiàn)“列表上還有,將它在軟件上做過的、抓取文本意義的實(shí)驗(yàn),與Labyrinth中漫游的軟件實(shí)驗(yàn)結(jié)合起來——有一個(gè)可能性是在虛擬空間內(nèi)開始擺上標(biāo)識(shí)。Hassabis說,他還在計(jì)劃一種“野心勃勃”的方法,來測(cè)試是否準(zhǔn)備好面對(duì)比Labyrinth更加真實(shí)的世界。他希望DeepMind未來可以控制機(jī)器人,他認(rèn)為機(jī)器人受限于軟件對(duì)世界的理解能力?!坝幸恍┖芰瞬黄鸬臋C(jī)器人,不能充分發(fā)揮他們的能力因?yàn)檫€沒有算法?!彼f。

如果成功,那會(huì)引發(fā)一些關(guān)于人的本質(zhì)定義、以及人工智能的合理使用范圍等嚴(yán)肅的哲學(xué)和倫理問題。Hassabis說,他鼓勵(lì)人們討論這項(xiàng)技術(shù)可能的風(fēng)險(xiǎn)。(雖然他滿意地表示,物理學(xué)家Stephen Hawking在于他見面后,已經(jīng)停止警告人工智能會(huì)毀滅人類;將人工智能研究比作”召喚魔鬼“的Tesla創(chuàng)始人Elon Musk也被潑了冷水。)DeepMind有一個(gè)內(nèi)部的哲學(xué)家、律師和商人團(tuán)隊(duì)。Hassabis說也許”很快“就會(huì)公布他們的名字,以及他也在努力召集一隊(duì)類似的外部團(tuán)隊(duì),在多個(gè)計(jì)算機(jī)公司間共享。

DeepMind的工程師們?cè)O(shè)計(jì)新實(shí)驗(yàn)暫時(shí)還不需要倫理學(xué)指導(dǎo),Hassabis說。”距離我們能擔(dān)心的成果還遠(yuǎn)著呢,“他說,”更重要的是讓所有人加快速度?!叭绻卸既鏗assabis所愿,他的倫理團(tuán)隊(duì)才能真的有點(diǎn)事兒做。

uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多