ČOVJEK VS. STROJ

ROBOTIKA 'Nakon umjetne inteligencije sada je novi cilj: umjetna intuicija'

Meč kompjutera AlphaGo koji je pobijedio najboljeg svjetskog igrača u igri go Lee Sedola može se opisati kao povijesni. Razlog je u tome što za šah kompjuter samo mora "izvrtjeti" sve kombinacije. Za uspjeh u igri go, naprotiv, potrebna je intuicija

Piše:

Arhiva

Objavljeno: 17. ožujak 2016. 17:53

Snimka: Reuters

Globus

Danas je već općeprihvaćeno da u razvoju suvremene tehnologije značajno mjesto ima filozofija. Može se samo nagađati bi li bez simboličke logike uopće bilo tehnološkog razvitka kojemu svjedočimo (iako se može nagađati i obratno, bi li bilo formulacije simboličke logike bez prethodnog eksperimentiranja s tehnologijama). Ne radi se, dakle, o etičkom propitivanju suvremenog svijeta, nego filozofija sudjeluje u njegovu stvaranju. Možda je to najvidljivije u razvoju umjetne inteligencije. U najvažnijem i najvećem (više od 1000 stranica) svjetskom udžbeniku umjetne inteligencije Stuarta Russella i Petera Norviga cijelo je poglavlje posvećeno filozofskim korijenima umjetne inteligencije, a filozofsko razumijevanje problema konzultirano je i u ostalim poglavljima, kao što su znanje, osjetilnost itd. Jedno od filozofskih pitanja ključnih za razvoj umjetne inteligencije jest – kako učimo, u smislu kako spoznajemo svijet oko sebe? Može li stroj oponašati našu metodu učenja? Inovativan odgovor na to pitanje omogućio je Googleovu laboratoriju za umjetnu inteligenciju DeepMind da upravo sruši još jednu barijeru pred umjetnom inteligencijom, da pobijedi svjetskog prvaka, Koreanca Lee Sedola u najkompleksnijoj igri na ploči, kineskom go. Stroj koji je to izveo zove se AlphaGo, no je li to uopće stroj ili softver, algoritam, čista misao? To je pitanje!

Cijeli je svijet meč pratio s ekstremnom pažnjom. Predviđeno je da traje pet partija, pa iako se Lee Sedol hvalio da će smatrati porazom izgubi li ijednu, AlphaGo se nije pokolebao: meč je odlučio u prve tri. U trenutku kad ovaj tekst ide u tisak Lee Sedol je ublažio poraz. Već nakon što je AlphaGo pobijedio u prvoj partiji, uslijedile su tisuće komentara. Lei Jun, čelnik jedne od najvećih kineskih tehnoloških kompanija Xiaomi, napisao je u Tech In Asia da je za trajanja velikog partijskog kongresa neprestano pogledavao u svoj mobitel i uzbuđen pratio meč. Upravo on podsjetio je na prvu bitnu razliku između igrača. Koreanac Lee Sedol nevjerojatni je talent za go, jedinstveni primjerak ljudske vrste, teško da će se još mnogo takvih roditi, ali njegova mogućnost osobnog prenošenja svoje vještine na druge je ograničena. Nasuprot tome, piše Lei Jun, Googleov kompjuter AlphaGo može biti instaliran na beskrajnom mnoštvu strojeva. Uostalom, svjetskog prvaka u šahu Garija Kasparova pobijedio je moćni IBM-ov DeepBlue prije 20 godina, a danas programi koji pobjeđuju svjetske prvake u šahu mogu biti instalirani na svačiji PC. Šah danas više nije ono što je bio.

Je li dakle AlphaGo uopće stroj, ili ono što se naziva – virtualni stroj. Što je to? Doduše, u tekstu londonskog The Economista naslovljenom “Showdown” wn” (Konačnispit) ističe se da su i fizičke karakteristike stroja na kojem AlphaGo radi također razlog njegove prednosti pred konkurencijom.

“Verzija koja igra protiv Lee Sedola”, piše The Economist, “koristi se sa 1920 standardnih procesora i 280 specijalnih, koji su izvorno razvijeni za grafiku za videoigre, što je vrlo zahtjevan zadatak.” Kao da je ušao u tijelo Terminatora. AlphaGo se nije u ovom meču sasvim odrekao pristupa putem brutalne snage (brute force), kojim se DeepBlue protiv Kasparova ustvari koristio.

O čemu je riječ? O onome što uobičajeno podrazumijevamo kad kažemo da kompjuter “misli”, o “stupidnom” analiziranju svih ishoda svih poteza, jedan po jedan, i onih koji su već na prvi pogled besmisleni i – u slučaju šaha – vode u poraz u jednom potezu. Služeći se brutalnom snagom kompjuter analizira i poteze na koje iskusan igrač uopće ne obraća pažnju i one koje samo preleti i bez krzmanja odbaci. Upravo će zato većina ljudi reći da je kompjuter “glup”. Kad je DeepBlue pobijedio Kasparova, jedan od osnivača umjetne inteligencije John McCarthy rekao je da je to Pirova pobjeda upravo zato što je kompjuter igrao “glupo”. (O tome postoje oprečna mišljenja.)

Filozofski, “glupost” kompjutera formulira se kao “the frame problem” (problem okvira). Najlakše ga je ilustrirati scenom iz animiranog filma u kojoj se robotu naredi da spasi bebu iz sobe u kojoj otkucava bomba, a on s kolijevkom iznese i bombu. Kako da mu sve objasniš kad je “glup”? Zato kompjuteru možeš dati samo precizno definirane zadatke. Ako napravi glupost, sam si kriv.

S druge su strane kompjuteri puno bolji nego ljudi ne samo u aritmetici nego i u logici, vještinama koje često smatramo znakovima inteligencije. Ilustrira to tzv. Wason Selection Task: Zamislimo špil karata koje na jednoj strani imaju slovo, a na drugoj broj. Predočene su četiri karte – E; T; 4; 7. Koje karte, što manje njih, treba okrenuti da se provjeri je li točno pravilo prema kojem je s nevidljive strane parni broj ako je na vidljivoj strani samoglasnik. Do odgovora E i 7 računalo dolazi u milimilimilisekundi, a samo pet posto obrazovanih ljudi daje točan odgovor. U tome su kompjuteri superiorni ljudima. Drukčije formuliran isti zadatak ljudi rješavaju jednako brzo kao kompjuteri, u času. Nemaju nikakvih problema s razumijevanjem logike “ako se posudi auto, treba napuniti rezervoar” – gdje su četiri karte zamijenjene sa (automobil posuđen); (automobil nije posuđen); (rezervoar napunjen); (rezervoar prazan). Ovako formuliran isti logički zadatak ljudi razumijevaju “intuitivno”, kao iz nataloženog iskustva čiju logiku lako mogu i objasniti.

Za razliku od aritmetike, logike i šaha, go se igra “intuitivno”, bijelim i crnim žetonima na ploči 19 puta 19 polja. Cilj je samo jedan, osvojiti teren, bilo postavljanjem svojih žetona ili okruživanjem i istiskivanjem tuđih. Zahvaljujući tome što se igra na manjoj ploči i ima više pravila, šah ima manje mogućnosti. Poznata je priča o vladaru koji je ustanovio da na svijetu nema toliko zrna žita koliko bi se moralo skupiti ako se dobije zadatak da se na prvo stavi jedno, na sljedeće dva, zatim četiri, pa osam itd. Svejedno, broj mogućnosti u šahu kompjuteru je postao praktički dohvatljiv. Nasuprot tome, go ima broj mogućih igara neizmjerno veći nego (pretpostavljeni) broj atoma u svemiru. Iza svakog šahovskog poteza igrač u prosjeku ima na raspolaganju 35 poteza. Go je složeniji – prosječni broj mogućnosti je 250. Taktički potez u prvom razdoblju igre može postati strateški važan u kasnijem razdoblju. Može, ali ne mora. To se vrlo zorno pokazalo u meču u Seoulu.

Kad šahovski prvak priča o svom sljedećem potezu, on je najčešće u stanju objasniti njegov smisao. Go je drukčiji. Vrhunski igrači svoje poteze objašnjavaju generalnim principima ili intuicijom. Često se služe i riječima koje opisuju emocije ili osjećaj za lijepo. Nakon poraza u odlučujućoj trećoj partiji Lee Sedol izjavio je jedino to da nikad nije igrao meč u kojem je osjećao toliki pritisak. Europski prvak izjavio je da je AlphaGo “zadivljujuće, čudesno” (amazingly) kontrolirao partiju. Poteze koje je izveo AlphaGo protiv Lee Sedola profesionalni komentatori opisivali su kao “iznenađenje” ili kao “agresivne”. Nisu ih uspijevali razumjeti, kamoli objasniti. Ako je, dakle, AlphaGo pobijedio Lee Sedola, a nije se služio brutalnom snagom, analizom svake mogućnosti, jer za to nije dovoljno snažan ni sam, kako je u tome uspio? Je li AlphaGo razvio intuiciju, dosad ljudsku osobinu?

Posljednjih godina razvile su se tehnologije umjetne inteligencije kao što su Monte Carlo tree search, neural network i reinforcement learning. Monte Carlo tree search specijalni je način analize grananja (tree – drvo, search - istraživanje) mogućnosti, a putem neural networka umjetna inteligencija nastoji oponašati mrežu živaca u ljudskom mozgu koja nekako iz nepreglednog mnoštva pojedine informacije selekcionira po važnosti. Demis Hassabis, koji se godinama bavio kompjuterskim igrama, prije nego što je osnovao Googleov laboratorij DeepMind, i koji stoji iza AlphaGo, doktorirao je neurologiju. U AlphaGo unesene su sve moguće go-partije iz kojih je učio, služeći se spomenutim tehnikama. Uglavnom, AlphaGo učio je od ljudi. To je u umjetnoj inteligenciji vrlo raširen postupak. Na taj način kompjuteri, na primjer, uče prevoditi, i sve su bolji. Koristeći se beskrajnim mnoštvom primjera iz kojih izvlače obrasce pišu novinske članke, prepoznaju oblike, lica, lokacije itd.

Tu sad dolaze iznenađenja. Prema riječima Googleovih inženjera, “prije nekog vremena AlphaGo je prestao bazirati svoju igru na mečevima koji su prije zabilježeni”. Prestao je, dakle, učiti od ljudi. Naime, nakon što je pregledao tolike mečeve goa koje su igrali ljudi i iz njih izveo zaključke, što je još uvijek “strojni” način “mišljenja”, aktiviran je način učenja koji se naziva deep reinforcement learning, a u kojem je AlphaGo odigrao milijune partija sam protiv sebe. Što je naučio u tom procesu?

Prije valja razmisliti što u slučaju kompjutera znače riječi “sam protiv sebe”, što znači da je igrao sam protiv sebe. Po logici stvari, ako smo još uopće u području logike, igrati sam sa sobom, ustvari sam protiv sebe, znači da treba nastojati maksimizirati dobitak one strane koja je na potezu. Čovjeku to, svi znamo, nije sasvim lako. Nije čudno ako se malo “vara”, odnosno ako se nakon poraza/pobjede zaključi da je postojala “pristranost”. Za računalo to je na prvi pogled jednostavno. Je li? I računalo povlači najbolji potez na koji u sljedećem trenutku treba odgovoriti još boljim. Ako je sljedeći još bolji, zašto ga računalo nije prije predvidjelo? U nekoj igri kao što je križić-kružić ili dama računalo završi prije nego što je započelo. Kad igra go i ono ima granice. Kad dakle AlphaGo igra go sam sa sobom, što su inputi a što obrada? Input je najbolji mogući sljedeći potez, a obrađuje se tražeći najbolji mogući sljedeći potez. Prema oksfordskom filozofu Lucianu Floridiju, već je Alan Turing, utemeljitelj teorijskog računalstva, putem konstrukcije univerzalnog stroja ustanovio da između programa i podataka i nema bitne razlike. Sve su to “brojke” (digits).

Navodno, ni Googleovi inženjeri ne znaju kako je AlphaGo pobijedio, što je saznao igrajući sam sa sobom. The Economist piše da je AlphaGo razvio vlastitu intuiciju, pravila igre koja ljudi “razumiju, ali nisu u stanju objasniti”. Ljudi znaju kako kompjuter rješava logičku zagonetku Wason Selection Task i zašto je bolji. Ako je pravilo “igraj go agresivno”, premda AlphaGo na taj način pobjeđuje, ljudi ne znaju zašto. U partiji u kojoj je Lee Sedol koliko-toliko vratio čast, u kojoj je pobijedio, AlphaGo je ponovno igrao agresivno, kao da je po istoj metodi nastojao “pritiskati” svjetskog prvaka, ali mu se to ovaj put nije isplatilo. Taktički su se potezi pokazali promašajima.

Sve je to možda mistifikacija. Laboratorij DeepMind, koji je Google prije dvije godine kupio za pola milijarde dolara, od Hassabisa i njegovih australskih partnera, razvio je tehnologije, piše The Economist, koje imaju široku komercijalnu primjenu: u lovu na subatomske čestice u ciklotronima, u diseminaciji relevantnih reklama različitim internet-korisnicima, u poučavanju kompjutera (!). U velikom intervjuu koji je dao tehnološkom portalu The Verge, Demis Hassabis spominje interes za komercijalne robote višeg stupnja inteligencije od samostalnog usisavača, čak i od automobila koji sam vozi. On sam prije umjetne inteligencije imao je uspješnu karijeru u razvoju komercijalnih kompjuterskih igara, a najavljuje – što je vrlo važno – razvoj umjetne inteligencije koja će moći uspješno igrati StarCraft. Konceptualna razlika u odnosu na šah i go sastoji se u tome da se u StarCraftu, za razliku od šaha ili goa, mogu pojaviti potpuna iznenađenja, koja prije nisu mogla biti ni pretpostavljena. Da se pobijedi u StarCraftu, osim intuicije bit će potrebno razviti snalaženje u novoj situaciji. To je više od logike i intuicije, to je ono što stvarno smatramo inteligencijom.

Malo je, dakle, vjerojatno da je utakmica s Lee Sedolom bila samo predstava bez poslovnih planova. Kao otvorena opcija ostaje međutim uočavanje velikog filozofa 20. stoljeća Wittgensteina da se strojevi lome. Iako izgledaju savršeno složeni, prema svim zakonima mehanike. Čak i virtualni strojevi, s kojima je počela ova priča. Oni imaju tzv. halting problem. Alan Turing dokazao je da ne postoji algoritam na osnovi kojeg bi se zaključilo hoće li neki program dani input obrađivati vječno ili ga uspjeti obraditi. Preostaje sad, dakle, da go pobijedi AlphaGo, da on započne igru sam sa sobom i da je nikad ne završi. Osim što bi se pregrijao nikad, naravno, ne bismo saznali što se dogodilo.

SADRŽAJ JE PREUZET IZ JEDNOG OD PROŠLIH BROJEVA GLOBUSA. DOLJE POGLEDAJTE NASLOVNICU NOVOG BROJA GLOBUSA, KOJEG NA SVIM KIOSCIMA MOŽETE KUPITI OD SRIJEDE:

Vezane vijesti

Go player Lee Sedol (R), puts the first stone against Google's artificial intelligence program AlphaGo as Google DeepMind's lead programmer Aja Huang (L) looks on during the Google DeepMind Challenge Match in Seoul, South Korea, in this handout picture provided by Korea Baduk Assosication and released by News1 on March 9, 2016. REUTERS/Korea Baduk Association/News1ATTENTION EDITORS - FOR EDITORIAL USE ONLY. NOT FOR SALE FOR MARKETING OR ADVERTISING CAMPAIGNS. THIS IMAGE HAS BEEN SUPPLIED BY A THIRD PARTY. IT IS DISTRIBUTED, EXACTLY AS RECEIVED BY REUTERS, AS A SERVICE TO CLIENTS. SOUTH KOREA OUT. NO COMMERCIAL OR EDITORIAL SALES IN SOUTH KOREA. NO RESALES. NO ARCHIVE.

POBJEDA ALPHAGOA KAKO JE RAČUNALO UBILO SVJETSKOG PRVAKA U POJAM Pali se zadnje zvono za uzbunu: Dolazi svijet u kojem će ljudski radnici biti suvišni

BUDUĆNOST JE STIGLA KOMPJUTOR NAPISAO ROMAN I UMALO OSVOJIO KNJIŽEVNU NAGRADU! Pisci SF-a u nevjerici: 'Nevjerojatno je da ga je napisao stroj!'

Želite li dopuniti temu ili prijaviti pogrešku u tekstu?