VRIJEME STROJEVA KOJI SAMI UČE

JESTE LI PRIMIJETILI KAKO JE GOOGLE TRANSLATE IZNENADA POSTAO DALEKO BOLJI? Evo što stoji iza naglog poboljšanja alata koji su mnogi prezirali

 ChinaFotoPress via Getty Images / Getty Images
Ljudska bića ne uče jezike tako da napamet bubaju rječnike i gramatičke priručnike, zašto bismo od računala očekivali da ih tako uče?

Početkom prosinca brojni korisnici Googleove platforme za prevođenje Translate - točnije, oni koji tu aplikaciju koriste za prevođenje između najvećih svjetskih jezika - primijetili su nešto vrlo neobično: postala je nemjerljivo bolja.

Studenti, znanstvenici, novinari i tisuće drugih korisnika koji su prevodili s, recimo, engleskog na njemački ili na španjolski, počeli su primjećivati da su rečenice koje upisuju u jednu kućicu u drugoj počele izlaziti gramatički i pravopisno točne do te mjere da im je bilo teško vjerovati kako je posao odradio računalni algoritam. U korijenu te evolucije bio je prelazak cijeloga Googlea na sasvim novi princip postojanja, princip koji CEO tvrtke Sundar Pichai naziva “A.I. first” - umjetna inteligencija u temelju svega. Novi Google Translate predstavlja završetak inicijalne faze toga Googlea budućnosti, koji bi u praksi trebao biti kompanija čiji proizvodi više neće biti plod tradicionalnoga računalnog programiranja, već umjetne inteligencije (UI) i strojnog učenja.

Mistična budućnost

Odjel unutar tvrtke pod nazivom Google Brain osnovan je prije pet godina upravo na teoriji da umjetne “neuronske mreže”, koje upoznaju svijet oko sebe kroz pokušaje i pogreške, otprilike kao mala djeca, mogu razviti nešto nalik fleksibilnosti koju posjeduju ljudska bića. Ta teza nije nova, razmatrana je još u počecima moderne računalne znanosti 40-ih godina prošlog stoljeća, ali uglavnom je bila u sferi neke mistične, neuhvatljive budućnosti. No od 2011. godine Google Brain počeo je demonstrirati da ima pristup umjetnoj inteligenciji koji bi mogao riješiti mnoge desetljetne probleme koji su kočili konvencionalne metode razvoja. Prepoznavanje govora, recimo, nije radilo osobito dobro dok ga Brain nije preradio, postavio na princip strojnog učenja i primijenio na Googleovom mobilnom operativnom sustavu Android, kod kojeg transkripcija govora danas funkcionira gotovo bez greške (opet, govorimo o velikim svjetskim jezicima, poglavito engleskom).

Translate je debitirao 2006. godine i u međuvremenu je postao jedan od Googleovih najpopularnijih i najpouzdanijih alata. Ima više od 500 milijuna aktivnih mjesečnih korisnika i prevodi 140 milijardi riječi na dan. Postoji ne samo kao samostalna aplikacija, nego i kao nadogradnja Gmaila, Chromea… a s nedavnom izbjegličkom krizom, kaže Pichai, Google je shvatio i geopolitički značaj Translatea. Naime, u posljednjih godinu i pol peterostruko je povećano prevođenje između arapskog i njemačkog. Tim iza Translatea organski je razvijao platformu, dodavao nove jezike i mogućnosti, ali u posljednje četiri godine nije bilo značajnijega kvalitativnog pomaka. Sve do početka prosinca 2016., kad je većina prometa Google Translatea u SAD-u i većem dijelu Europe i Azije prebačena u sustav baziran na umjetnoj inteligenciji. Početna tranša uključivala je prijevode između engleskog i španjolskog, francuskog, kineskog, njemačkog, portugalskog, japanskog, korejskog i turskog. Preostalih stotinjak jezika koje Translate podržava trebali bi biti prebačeni na UI sustav do kraja godine, tempom od oko osam jezika mjesečno (hrvatski je još na starom sustavu). Nova inkarnacija Translatea nije zadivila samo korisnike, nego i Googleove inženjere: pokazalo se da je UI sustav praktički preko noći napredovao toliko koliko je stari sustav napredovao tijekom cijelog svog postojanja.

Druga vizija

U doba kada je pojam umjetna inteligencija (artificial intelligence) skovan, na Sveučilištu Dartmouth 1956. godine, smatralo se da je najbolji pristup stvaranju takvog sustava sljedeći: napisati veliki, sveobuhvatni program koji bi sadržavao pravila logičkog razmišljanja i dovoljno činjeničnog znanja. Pa ako biste, recimo, htjeli prevoditi s engleskog na njemački, u računalo biste unijeli sva gramatička pravila engleskog jezika, pa onda cijeli sadržaj Oksfordskoga rječnika engleskog jezika, pa onda sva gramatička pravila njemačkog jezika, pa onda sve postojeće riječi njemačkog jezika - i tek nakon svega toga u računalo bi se mogla unijeti rečenica na jednom jeziku i tražiti ga da formulira prijevod na drugom. Takav pristup najčešće se naziva “simbolička umjetna inteligencija”. No, takav pristup za sobom vuče dva problema. Prvi je to da je vremenski vrlo zahtjevan. Drugi je da istinski funkcionira samo u onim domenama u kojima su pravila i definicije kristalno jasne - u matematici ili šahu, primjerice. Prevođenje, s druge strane, amblematski je primjer područja na kojemu takav pristup katastrofalno propada u praksi, jer se riječi ne mogu svesti samo na svoje rječničke definicije, i jer prevođenje ponekad ima više iznimaka nego pravila.

Cijelo vrijeme postojala je i druga vizija umjetne inteligencije - “opća umjetna inteligencija” - prema kojoj bi računala učila “iz temelja”, dakle iz podataka, umjesto “s vrha”, odnosno počevši od pravila. Takav pristup može se datirati u 40-e godine, kada je znanstvenicima palo na pamet da bi najbolji model za fleksibilnu automatiziranu inteligenciju mogao biti sam ljudski mozak. Mozak je, na kraju krajeva, samo skup neurona koji ili proslijede električni signal svojim susjedima ili ga ne proslijede. Važnije od individualnih neurona su veze koje postoje među njima. Ta jednostavna struktura mozgu daje niz prednosti prilikom adaptacije na različite okolnosti. Mozak može funkcionirati i kada ima loše informacije ili ih nema uopće; može podnijeti priličnu štetu bez gubitka kontrole; može pohraniti velike količine znanja na vrlo učinkovit način; može se držati različitih zadanih obrazaca i istovremeno zadržati spontanost potrebnu da se nosi s dvosmislenim zadacima.

Prosječni mozak

Naravno, računala se ni izbliza ne mogu uspoređivati s ljudskim mozgom. Prosječni mozak ima negdje oko 100 milijardi neurona. Svaki je neuron povezan s najviše 10.000 drugih neurona, što znači da je broj sinaptičkih veza negdje između 100 bilijuna i 1000 bilijuna. Replicirati mrežu te veličine još uvijek nam je izvan dosega, ali investicija koju je poduzeo Google Brain omogućila je stvaranje mreže koja je usporediva s mozgom miša.

Takav pristup umjetnoj inteligenciji više je evolucijski nego kreacionistički. Ako želite razviti nešto što će se s vremenom moći adaptirati, ne želite početi indoktrinacijom u pravila šaha, nego s nekim osnovnim mogućnostima - osjetilnom percepcijom, motoričkom kontrolom - u nadi da će se napredne vještine razviti organski. Naime, kako ni ljudska bića ne uče razumijevati jezike tako da napamet bubaju rječnike i gramatičke priručnike, zašto bismo od računala očekivali da ih tako uče? Google Brain prva je velika institucija koja je investirala značajna sredstva u mogućnosti koje pruža takva škola mišljenja.

Novi val

Istovremeno, Googleova odluka da se cijela tvrtka reorganizira oko umjetne inteligencije bila je prva manifestacija svojevrsnog delirija oko strojnog učenja koji je zahvatio čitavu industriju. U posljednjih pet godina brojne tvrtke - a poglavito Google, Apple, Facebook, Microsoft, Amazon i kineski Baidu - pokrenule su bespoštedni lov na kadrove s darom za UI, poglavito na sveučilišnoj razini. Korporativna obećanja o silnim sredstvima i kreativnim slobodama stanjila su vrhunske akademske odjele. Široko je poznato u Silicijskoj dolini da Mark Zuckerberg, CEO Facebooka, osobno nadgleda regrutaciju najpoželjnijih studenata, preko telefonskih i videopoziva. Plaće koje počinju sa sedam znamenki nisu rijetke. Broj posjetitelja na najvažnijim znanstvenim konferencijama koje se bave tim poljem učetverostručio se. Na kocki nije samo još jedna rubna inovacija, nego kontrola nad područjem koje bi moglo predstavljati cijelu novu računalnu platformu - sveobuhvatna, opća umjetna inteligencija.

Pichai u svakoj prilici ističe razliku između trenutačnih primjena UI i finalnog cilja “opće umjetne inteligencije”. Takva umjetna inteligencija neće podrazumijevati samo praćenje jasnih uputa, nego će imati mogućnost interpretiranja. Bit će sveobuhvatan, općeprihvaćeni alat. Pichai vjeruje da budućnost samoga Googlea ovisi o tome, jer UI ima šire primjene od samog Translatea.

Evo primjera. Zamislite da Google Mapsu možete reći kako želite ići na aerodrom, ali da usput morate otići nekamo kupiti dar za nećaka. Verzija te aplikacije koja ima bolju opću umjetnu inteligenciju - recimo, svemoguća osobna asistentica poput one iz filma Spikea Jonzea “Her”, sa Scarlett Johansson - znala bi stvari koje može znati samo blizak prijatelj ili član obitelji: koliko nećak ima godina, koliko inače trošite na darove za djecu, koliko ste prije trošili na tog nećaka i što ste mu kupovali, ali i gdje postoji otvorena trgovina s takvim stvarima. No, zbiljski inteligentna inačica Mapsa znala bi i stvari koje prijatelj možda ne bi znao, primjerice, što je ovih dana popularno među školarcima nećakove dobi, što je od takvih stvari nedavno došlo u dućane i slično. Inteligentni stroj koji može razlučiti uzorak u podacima o našem prošlom ponašanju, bit će u stanju ekstrapolirati naše buduće želje i potrebe, čak i ako ih mi još nismo svjesni.

Novi val osobnih asistenata obogaćenih umjetnom inteligencijom - Appleov Siri, Facebookov M, Amazonov Echo i, na kraju, Googleov Assistant - plodovi su ideje strojnog učenja. Naravno, strojno učenje u korporativnom svijetu ne završava samo predviđanjem želja kupaca. Tvrtke širom svijeta pripremaju se za obilje primjena koja će imati računala koja programiraju sama sebe i uče iz dana u dan.

Scenarij Skynet

Oponenti umjetne inteligencije i proponenti teorija zavjere, naravno, na ovome će mjestu potegnuti pitanje “scenarija Skynet”, prema kojemu će umjetna inteligencija koju smo stvorili da nam olakša kupnju dara za nećaka jednog dana odlučiti kako je jednostavnije ukloniti i nas i nećaka s lica zemlje. To nije način na koji UI funkcionira. Funkcionira tako da pretražuje informacije u potrazi za zajedničkim detaljima, isprva za osnovnim uzorcima, pa potom kompleksnijim, pa još kompleksnijim. Najveća opasnost, barem zasad, krije se u tome da one početne informacije koje dajemo računalu mogu biti pogrešne ili pristrane.

Plodovi strojnog učenja nisu pitanje budućnosti: DeepMind, proizvod britanske tvrtke za UI, koju je Google kupio 2014., pobijedio je dotadašnjeg ljudskog velemajstora igre na ploči Go, iako su predviđanja govorila da će za takav pothvat biti potrebno još najmanje 10 godina.

U svom slavnom eseju iz 1950. godine, Alan Turing je predložio jednostavan test umjetne inteligencije: računalo koje bi moglo unutar petominutne razmjene tekstualnih poruka uspješno zavarati ljudskog sugovornika. Jednom kada stroj može tečno prevoditi između dva jezika postavljeni su temelji za stroj koji bi jednog dana možda mogao “razumjeti” ljudski jezik dovoljno dobro da vodi razgovor. Članovi tima Google Brain, koji su vodili projekt Translatea, vjeruju da bi takav stroj mogao biti opće inteligentan i sveobuhvatan digitalni osobni asistent.

Želite li dopuniti temu ili prijaviti pogrešku u tekstu?
Linker
25. studeni 2024 04:44