Hoće li nas umjetna inteligencija pobijediti? To je u posljednje vrijeme pomalo dosadna mantra svih nas – kao kad se pitamo hoće li učenik nadmašiti učitelja. Umjesto strahovanja od novog, možda je u ovom trenutku važnije vidjeti kako mi to zapravo podučavamo tu umjetnu inteligenciju. Krenimo redom.
Slično je bilo i s ranijim tehnologijama, a sve je ovisilo o tomu kako smo ih dizajnirali i njima upravljali. No ako ćemo uvlačenje umjetne inteligencije u naš život doživljavati kao znanstvenu fantastiku, onda smo unaprijed izgubili bitku.
Neuronske mreže uče kao i mozak
Umjetna inteligencija jednostavno je pojam koji se odnosi na skupinu tehnologija koje koriste strojeve za simulaciju rada ljudskog uma. Koristeći algoritme i matematiku AI analizira skupove podataka, daje predviđanja, prepoznaje obrasce i generira sadržaj. Kao što ljudi uče kroz iskustva, eksperimentiranje i upijanje novih informacija, umjetna inteligencija razvija svoje vještine analizirajući goleme količine podataka. Ova analogija s ljudskim procesom učenja posebno je očita u koncepciji neuronskih mreža, koje oponašaju funkcioniranje ljudskog mozga.
Podaci se najprije prikupljaju iz različitih izvora u obliku teksta, zvuka, videa itd. Razvrstavaju se u kategorije, poput onih koje algoritmi mogu čitati i onih koje ne mogu. Sljedeći je korak omogućiti umjetnoj inteligenciji da odluči što će učiniti s tim podacima. AI razvrstava i dešifrira podatke pomoću obrazaca za koje je programiran da uči sve dok ne prepozna slične obrasce u podacima koji se filtriraju u sustav.
Milijarde stranica podataka
Umjetnu inteligenciju možete čak smatrati digitalnim mozgom, koji može učiti iz iskustva. Baš kao što identificirate psa gledajući više primjera, umjetnoj inteligenciji je potrebna obuka za otkrivanje objekata, razumijevanje jezika i izradu na primjer slike analizom golemih uzoraka. Na primjer, ChatGPT je istreniran na velikim zbirkama tekstualnih podataka, kao što su knjige, članci i web stranice. OpenAI je koristio skup podataka pod nazivom Common Crawl, koji je javno dostupan korpus web stranica. Riječ je milijardama web stranica i jedan je od najvećih dostupnih skupova tekstualnih podataka.
Treniraju se zapravo negdje unaprijed stvoreni modeli umjetne inteligencije, tj. programi koji otkrivaju specifične obrasce pomoću zbirke skupova podataka.
Načelo pokušaja i pogreške
A modeli funkcioniraju tako što obrađuju ulazne podatke, rudare ih pomoću algoritama i statističkih tehnika kako bi otkrili obrasce i odnose među njima, a zatim koriste ono što su otkrili, kako bi predvidjeli ili djelovali na naknadne unose podataka. Čovjek modelu unosi upite i podatke, podešava ih, korigira i na taj ih način trenira. Puno toga se događa po načelu pokušaja i pogreške. Drugim riječima, model poduzima određene radnje, zatim dobiva pozitivno ili negativno potkrepljenje, ovisno o tome je li postigao zadovoljavajući ishod.
Stručnjaci za obuku modela AI jesu inženjeri strojnog učenja, podatkovni znanstvenici te stručnjaci za strojno učenje. No u tom procesu često budu uključeni i dobri pisci, lektori, lingvisti, filolozi koji tečno barataju određenim jezikom koji se traži, a traži se sigurno više stotina svjetskih jezika. Naime, od stroja se očekuje da će odgovoriti na upite bilo kojeg jezika na svijetu i na upit s bilo kojeg mjesta. Neke od potrebnih vještina za treniranje modela AI jesu čitanje teksta kako bi se rangirao niz odgovora koje je proizveo AI model, zatim pisanje kratke priče o zadanoj temi i procjena je li dio zadanog teksta proizveden pomoću AI modela činjenično točan itd.
Možemo i sami trenirati umjetnu inteligenciju
Uz osobni pristup umjetnoj inteligenciji, u teoriji svatko od nas može trenirati AI model sa svojim podacima bez posjedovanja vještina strojnog učenja. Recimo putem učitavanja datoteka i postavljanja pitanja u sučelju za chat, a potom ispravljanjem sadržaja u željenom smjeru. No za to treba malo više strpljenja i dobrog poznavanja materije, sintakse određenog jezika i finog osjećaja za osmisliti točan i pravilan upit (eng. prompt). Pa pokušajte…







