Legfontosabb Innováció A Google mesterséges intelligenciája, az „Alpha Go Zero” csak megnyomta a Reset opciót a tanuláshoz

A Google mesterséges intelligenciája, az „Alpha Go Zero” csak megnyomta a Reset opciót a tanuláshoz

A Horoszkópod Holnapra

Emlékszel (homályosan) arra, hogyan tanultál meg járni, beszélgetni, biciklizni vagy vezetni? Rendetlen és tele volt hibákkal, de az így elsajátított készségek megmaradtak. Az élő rendszereken kívül kihívást jelentett elég erős algoritmusok felépítése a „valós élet tapasztalatainak” átvételéhez, és ragadós, alkalmazkodó viselkedés kialakításához a mesterséges intelligencia számára.

Nos, az Alpha Go Zero csak megcsinálta.

'Ez egy üres lapból indul ki, és csak saját maga számára derül ki, csak az önjátékból, és minden emberi tudás, emberi adat, tulajdonság vagy példák, vagy az emberek beavatkozása nélkül. Az első elvekből kiderül, hogyan kell játszani a Go játékát ”- mondja David Silver, a DeepMind professzora.

Az AI-nek többféle iterációja volt, mindegyik okosabb és képesebb, mint az előző. Az előző verzió a korábbi játékok hatalmas adatbázisát használta egy csomó algoritmus mellett, amelyek a győzelem felé mutattak. Ez a megközelítés a regnáló világbajnok profi Go játékos vereségéhez vezetett. A pókerben az AI Libratus a közelmúltban csaknem 2 millió dollárral nyúzta meg a világ legnépszerűbb pókerjátékosait, azzal is, hogy az emberi játék adatai helyett önjátékon keresztül tanult.

aki Mark Burett feleségül vette

Az Alpha Go ebben a legújabb verziójában a mesterséges intelligencia program tanított maga hogyan kell játszani a Go-t - emberi háttér nélkül.

Milliónyi játékszimulációt futtatva maga ellen, 40 napig tartott, mire megtanulta - a semmiből -, hogyan kell legyőzni a világbajnok verzióját. Ez valóban megváltoztatja a játékot, nem csak a Go esetében, hanem az új ismeretek felfedezésének módja is. Mennyire pontos vagy teljes a domain szakértelmed? Van nagyon több felfedezésre váró dolog, amit ez az izgalmas kísérlet mond el az Alpha Go Zero-val való tanulás során.

'Az Alpha Go ötlete nem az, hogy kimenjen és legyőzze az embereket, hanem valójában annak felfedezése, hogy mit jelent a tudomány - egy program számára, hogy képes legyen megtanulni önmagából, mi a tudás' - állítja Silver egy YouTube-bejegyzésben, az eredmény.

Az Alpha Go Zero Deep Mind csapata első elvnek nevezi a „tabula rasa” (üres pala) tanulást.

- Ha sikerül elérned Tabula rasa tanulva van egy ügynöke, amelyet át lehet ültetni a Go játékából bármely más tartományba, és a játék sajátosságai, olyan általános algoritmust állít össze, amely bárhol alkalmazható '- mondja . Ez egy provokatív ötlet, amikor kibővíti a koncepciót. Gondoljon csak arra, mit tehetnénk egy erős, tanulási algoritmusokkal, amelyek szisztematikusan képesek megoldani a nehéz problémákat és gyorsabban tanulni, mint civilizációnk kollektív tudása. . . napokban, nem évtizedekben.

milyen magas michaela conlin

Egyelőre az a nagy elvonás, hogy 'az algoritmusok sokkal többet számítanak, mint a számítások vagy a rendelkezésre álló adatok' - mondta Silver. Ez önmagában egy játékváltó abban, ahogyan hozzáállunk az ismert világ kiterjesztéséhez. Míg az Alpha Go körülbelül 25 millió dolláros hardvert futtat - ez nem éppen könnyű rendszer -, tudod, hogy az AI guruk már régóta dolgoznak tisztább, jobb adathalmazok létrehozásán. Ma sok nagy adatsort túl zajosnak tartanak - tele rossz adatokkal - ahhoz, hogy pontosan kiképezzék a mesterséges intelligenciát. Ha az AI tanul az adatokból, és az adatok rosszak, akkor nem tanulnak. Nagy probléma.

Mi lenne, ha nem tiszta adatokra lenne szükséged, hanem csak tapasztalatra, és a mesterséges intelligencia képes lenne kiképezni magát?

Ez az izgalmas eredmény az Alpha Go Zero-ban. Annak ellenére, hogy a játékok hiányos, szabályokon alapuló világában van, minden fizikai ágazatban jelentős következményekkel jár - gondoljunk a kémia, a forgalom, a biológia, a farmakológia, az utazás, a logisztika és a gyártás területére. Ha olyan rugalmasan tudjuk megtervezni a szabályokat, hogy szélesebb körű tapasztalatok alapján dolgozhatnak, és olyan irányúak, hogy mindig erősebb készségeket teremtsenek - például az Alpha Go Zero -, akkor lehetséges olyan mesterséges intelligenciát elérni, amely a rendszereket vezérli. Ezeknek a rendszereknek nincs szükségük külső adatokra, nincsenek adattisztítási problémák, és nincs szükségük a hurok emberben történő lassítására. Részben ezért fogadta el a Google anyavállalata, az Alphabet a mesterséges intelligenciát, és gyors ütemben fektet be a mesterséges intelligenciába. (Az Amazon szintén a mesterséges intelligenciába fektet be, mint például a legújabb mesterséges intelligencia-felvásárló BodyLabs.)

phil mattingly rokonságban áll don mattinglyvel

David Silver, a Deep Mind professzor azt mondja: 'Az a tény, hogy láttuk, hogy egy program magas szintű teljesítményt nyújtott ... azt jelentené, hogy most elkezdhetjük kezelni az emberiség számára a legnagyobb kihívást jelentő és leghatásosabb problémákat'.

Ezt a bejegyzést frissítettük annak tisztázása érdekében, hogy az AI Libratus nemrég legyőzte a legjobb pókerjátékosokat egy olyan stratégia alkalmazásával, amely az ember által bevitt adatok helyett önjátékot foglal magában.