AI: Uzorak nije u podacima, on je u stroju

Ne, obrasci koje stvaraju računala nisu inherentno svojstvo podataka, oni su pojavno svojstvo strukture samog programa.

Neuronska mreža transformira ulaz, krugove s lijeve strane, u izlaz s desne strane. Kako se to događa transformacija je težine, središta, koju često brkamo s uzorcima u samim podacima.
Tiernan Ray za ZDNET

Uobičajeno je mjesto umjetne inteligencije reći da strojno učenje, koje ovisi o golemim količinama podataka, funkcionira pronalaženjem obrazaca u podacima.

Fraza "pronalaženje uzoraka u podacima" zapravo je već godinama glavna fraza stvari kao što su rudarenje podataka i otkrivanje znanja, i pretpostavlja se da strojno učenje, a posebno njegova varijanta dubokog učenja, samo nastavljaju tradiciju pronalaženja takvih uzorci.

AI programi doista rezultiraju obrascima, ali, baš kao što "Greška, dragi Brute, ne leži u našim zvijezdama, već u nama samima," činjenica tih uzoraka nije nešto u podacima, to je ono što AI program čini od podataka.

Gotovo svi modeli strojnog učenja funkcioniraju putem pravila učenja koje mijenja takozvane težine, također poznate kao parametri, programa dok se program hrani primjerima podataka i, eventualno, oznakama priloženim tome podaci. Vrijednost utega se računa kao "znanje" ili "razumijevanje".

Uzorak koji se nalazi zapravo je obrazac kako se težine mijenjaju. Utezi simuliraju kako se vjeruje da pravi neuroni "pale", princip koji je formulirao psiholog Donald O. Hebb, koji je postao poznat kao Hebbijansko učenje, ideja da se "neuroni koji aktiviraju zajedno povezuju zajedno."

Također: AI za šezdeset sekundi

Upravo je obrazac promjena težine model za učenje i razumijevanje u strojnom učenju, nešto što su osnivači dubokog učenja naglašavali. Kao što je izraženo prije gotovo četrdeset godina, u jednom od temeljnih tekstova dubokog učenja, Parallel Distributed Processing, Tom I, James McClelland, David Rumelhart i Geoffrey Hinton napisali su:

Ono što se pohranjuje su snage veza između jedinica koje omogućuju stvaranje ovih obrazaca […] Ako je znanje snaga veza, učenje mora biti stvar pronalaženja prave veze kako bi se pravi obrasci aktivacije proizveli pod pravim okolnosti.

McClelland, Rumelhart i Hinton pisali su za odabranu publiku, kognitivne psihologe i računalne znanstvenike, i pisali su na vrlo drugačije doba, doba kada ljudi nisu stvarali lake pretpostavke da sve što računalo čini predstavlja "znanje". Oni su radili u vrijeme kada je AI programi uopće nisu mogli učiniti mnogo, i uglavnom su se bavili time kako proizvesti izračun - bilo koji izračun - iz prilično ograničenog rasporeda tranzistori.

Zatim, počevši s pojavom snažnih GPU čipova prije nekih šesnaest godina, računala su stvarno počela proizvoditi zanimljivo ponašanje, završeno značajnim ImageNet nastupom Hintonovog rada s njegovim diplomiranim studentima 2012. koji je označio početak dubokog učenja dob.

Kao posljedica novih računalnih dostignuća, popularni um počeo je graditi sve vrste mitologije oko umjetne inteligencije i dubokog učenja. Bilo navala jako loših naslova uspoređujući tehnologiju s nadljudskom izvedbom.

Također: Zašto AI izvještava tako loše?

Današnja koncepcija umjetne inteligencije zamaglila je ono na što su se usredotočili McClelland, Rumelhart i Hinton, naime, stroj i način na koji on "stvara" obrasce, kako su oni rekli. Bili su vrlo intimno upoznati s mehanikom utega koji konstruiraju uzorak kao odgovor na ono što je u ulazu bio samo podatak.

Zašto je sve to važno? Ako je stroj kreator obrazaca, onda su zaključci koje ljudi donose o umjetnoj inteligenciji vjerojatno uglavnom pogrešni. Većina ljudi pretpostavlja da računalni program opaža obrazac u svijetu, što može dovesti do toga da ljudi prepuste prosudbu stroju. Ako proizvodi rezultate, misli se, računalo mora vidjeti nešto što ljudi ne vide.

Osim što stroj koji konstruira uzorke ne vidi ništa eksplicitno. To je konstruiranje uzorka. To znači da ono što je "viđeno" ili "poznato" nije isto što i kolokvijalni, svakodnevni smisao u kojem ljudi govore o sebi da znaju stvari.

Umjesto da polazimo od antropocentričnog pitanja Što stroj zna? najbolje je krenuti od preciznijeg pitanja, Što ovaj program predstavlja u vezama svojih težina?

Ovisno o zadatku, odgovor na to pitanje ima mnogo oblika.

Razmotrite računalni vid. Konvolucijska neuronska mreža koja je u osnovi programa strojnog učenja za prepoznavanje slika i druga vizualna percepcija sastoji se od zbirke težina koje mjere vrijednosti piksela u digitalnom slika.

Rešetka piksela već je nametanje 2-D koordinatnog sustava stvarnom svijetu. Uz strojno prilagođenu apstrakciju koordinatne mreže, zadatak neuronske mreže predstavljanja ključa sve do usklađivanja snage zbirki piksela s oznakom koja je nametnuta, poput "ptica" ili "plava sojka."

U sceni koja sadrži pticu, ili posebno plavu šojku, mogu se događati mnoge stvari, uključujući oblake, sunce i prolaznike. Ali scena u cijelosti nije stvar. Ono što je važno za program je zbirka piksela koja će najvjerojatnije proizvesti odgovarajuću oznaku. Uzorak je, drugim riječima, reduktivni čin fokusiranja i selekcije svojstven aktivaciji veza neuronske mreže.

Mogli biste reći da program ove vrste ne "vidi" niti "opaža" toliko koliko on filteri.

Također: Novi eksperiment: Poznaje li AI doista mačke ili pse -- ili bilo što?

Isto vrijedi i za igre, gdje je umjetna inteligencija ovladala šahom i pokerom. U šahovskoj igri "punih informacija", kojom upravlja DeepMindov program AlphaZero, zadatak strojnog učenja svodi se na izradu rezultata vjerojatnosti u svakom trenutku koliko će potencijalni sljedeći potez dovesti do pobjede, poraza ili remija.

Budući da broj mogućih budućih konfiguracija ploča za igru ne mogu izračunati čak ni najbrža računala, utezi računala skraćuju potragu za potezima radeći ono što biste mogli nazvati sažimajući. Program sažima vjerojatnost uspjeha ako se slijedi nekoliko poteza u određenom trenutku smjeru, a zatim uspoređuje taj sažetak sa sažetkom mogućih poteza koje treba poduzeti u drugom smjer.

Dok stanje ploče u bilo kojem trenutku - položaj figura i koje figure ostaju - može nešto "značiti" ljudskom šahovskom velemajstoru, nije jasno da pojam "srednje" ima ikakvo značenje za DeepMindov AlphaZero za takav zadatak sažimanja.

Sličan zadatak sažimanja postiže se za program Pluribus koji je 2019. osvojio najteži oblik pokera, No-limit Texas hold'em. Ta je igra još složenija jer ima skrivene informacije, otvorene karte igrača i dodatne "stohastičke" elemente blefiranja. Ali reprezentacija je, opet, sažetak vjerojatnosti po svakom koraku.

Čak iu programima koji rukuju ljudskim jezikom, ono što je u težinama razlikuje se od onoga što slučajni promatrač može pretpostaviti. GPT-3, vrhunski jezični program iz OpenAI-ja, može proizvesti nevjerojatno ljudski izlaz u rečenicama i odlomcima.

Da li program "zna" jezik? Njegovi ponderi prikazuju vjerojatnost kako se pojedinačne riječi, pa čak i cijeli nizovi teksta nalaze u nizu s drugim riječima i nizovima.

Tu funkciju neuronske mreže možete nazvati sažetkom sličnim AlphaGou ili Pluribusu, s obzirom da je problem više poput šaha ili pokera. Ali moguća stanja koja se mogu predstaviti kao veze u neuronskoj mreži nisu samo ogromna, ona su beskonačna s obzirom na beskonačnu sastavljivost jezika.

S druge strane, s obzirom da je izlaz jezičnog programa kao što je GPT-3, rečenica, nejasan odgovor umjesto diskretnog rezultata, "točan odgovor" je nešto manje zahtjevan od pobjede, poraza ili remija u šahu ili poker. Ovu funkciju GPT-3 i sličnih programa također možete nazvati "indeksiranjem" ili "inventarom" stvari u njihovim težinama.

Također: Što je GPT-3? Sve što vaša tvrtka treba znati o OpenAI-jevom revolucionarnom jezičnom programu za umjetnu inteligenciju

Imaju li ljudi sličnu vrstu inventara ili indeksa jezika? Čini se da za sada u neuroznanosti nema nikakvih indikacija za to. Isto tako, u izrazu "reći plesaču iz plesa," uočava li GPT-3 višestruke razine značaja u frazi ili asocijacijama? Nije jasno da takvo pitanje uopće ima značenje u kontekstu računalnog programa.

U svakom od ovih slučajeva - šahovska ploča, karte, nizovi riječi - podaci su ono što jesu: oblikovani supstrat podijeljen na različite načine, set plastičnih pravokutnih proizvoda od papira, grupiranje zvukova ili oblicima. Znače li takvi izumi išta, zajedno, za računalo, samo je način da se kaže da se računalo prilagođava kao odgovor, sa svrhom.

Stvari koje takvi podaci zahtijevaju u stroju - filtri, sažimanja, indeksi, popisi ili kako god želite okarakterizirati te prikaze - nikada nisu stvar sama po sebi. Oni su izumi.

Također: DeepMind: Zašto je umjetna inteligencija tako dobra u jeziku? To je nešto u samom jeziku

Ali, možete reći, ljudi vide snježne pahulje i vide njihove razlike, te također katalogiziraju te razlike, ako to žele. Istina, ljudska je aktivnost oduvijek nastojala pronaći obrasce, na različite načine. Izravno opažanje jedno je od najjednostavnijih sredstava, au određenom smislu ono što se radi u neuronskoj mreži svojevrsno je proširenje toga.

Moglo bi se reći da neuronska mreža otkriva ono što je uvijek bilo istinito u ljudskoj aktivnosti tisućljećima, da je govoriti o obrascima stvar nametnuta svijetu, a ne stvar u svijetu. U svijetu pahuljice imaju oblik, ali taj oblik je samo obrazac onome tko ih skuplja, indeksira i kategorizira. Drugim riječima, to je konstrukcija.

Aktivnost stvaranja uzoraka dramatično će se povećati kako se sve više i više programa oslobađa na podataka svijeta, a njihove težine podešene su tako da tvore veze za koje se nadamo da će biti korisne reprezentacije. Takvi prikazi mogu biti nevjerojatno korisni. Možda će jednog dana izliječiti rak. Međutim, korisno je upamtiti da obrasci koje oni otkrivaju nisu tamo negdje u svijetu, oni su u oku opažača.

Također: DeepMindov 'Gato' je osrednji, pa zašto su ga napravili?

Umjetna inteligencija

7 naprednih ChatGPT savjeta za brzo pisanje koje morate znati
10 najboljih ChatGPT dodataka 2023. (i kako ih najbolje iskoristiti)
Testirao sam puno AI alata za rad. Ovo je mojih 5 najdražih do sada
Čovjek ili bot? Ova igra s Turingovim testom stavlja vaše vještine uočavanja AI na test