Najnoviji Googleov besplatni dar? Milijuni slika s naslovima za pomoć u obuci AI sustava

Google je objavio dva velika skupa podataka za koje se nada da će ubrzati napredak u računalnom vidu i razumijevanju videa.

Googleov skup podataka Open Images sastoji se od devet milijuna poveznica na web slike i opise objekata koje sadrže.
Slika: Google

Najnoviji Googleov dar javnosti je skup podataka od oko devet milijuna poveznica na označene slike za pomoć u obuci sustava računalnog vida.

Skup podataka, nazvan Open Images, pruža poveznice na slike na webu koje su označene opisima objekata unutar slike. Sastoji se od "strojno popunjenih" komentara, kao i komentara koje su potvrdili ljudi kako bi se uklonili lažni pozitivni rezultati.

Prema timu Google Research-a, skup podataka je dovoljno velik omogućiti istraživačima da ga koriste za treniranje duboke neuronske mreže "od nule".

Umjetna inteligencija

7 naprednih ChatGPT savjeta za brzo pisanje koje morate znati
10 najboljih ChatGPT dodataka 2023. (i kako ih najbolje iskoristiti)
Testirao sam puno AI alata za rad. Ovo je mojih 5 najdražih do sada

Čovjek ili bot? Ova igra s Turingovim testom stavlja vaše vještine uočavanja AI na test

Što se tiče razloga zašto Google objavljuje skup podataka, njegovi istraživači primjećuju da nedavni napredak u računalnom vidu nije vjerojatno dogodilo tako brzo bez dostupnosti drugih velikih, javno dostupnih skupova podataka za treniranje strojnog učenja mreže.

Primjeri takvih skupova podataka uključuju ImageNet, koji se sastoji od 14 milijuna slika, i Microsoftov COCO skup podataka za prepoznavanje, segmentaciju i titlove.

Bez ovih javnih izvora još ne bi bili dostupni automatizirani opisi slika i značajke kao što su Alloovi automatski odgovori na dijeljene snimke.

Novi skup podataka rezultat je suradnje između Googlea, Sveučilišta Carnegie Mellon i Sveučilišta Cornell.

Bilo je to iz istog razloga kao i Google nedavno objavljen YouTube-8M, skup podataka od osam milijuna YouTube videozapisa i oznaka na razini videozapisa koji bi mogli pomoći ubrzati istraživanje razumijevanja videozapisa i donijeti napredak u pretraživanju i otkrivanju videozapisa.

Skup podataka sastoji se od 500.000 sati videa koje je Google pripremio za istraživače korištenjem modela dubinskog učenja za izdvajanje 1,9 milijardi 'okvirnih značajki' i komprimiranih na manje od 1,5 TB.

Ideja je dati istraživačima mogućnost korištenja podataka za razumijevanje videa čak i ako im nedostaju veliki podaci i snažna računala za obradu videa.

Uobičajeno, ako bi istraživač želio analizirati podatke na razini YouTube-8M, trebao bi imati petabajt dostupnog prostora za pohranu i "desetke CPU-godina" procesorske snage, prema Googleu Istraživanje.

Pročitajte više o umjetnoj inteligenciji

Tri razloga zašto umjetna inteligencija upravo sada uzima maha (i što trebate učiniti u vezi s tim)
Umjetna inteligencija MIT-a prolazi ključni Turingov test
Googleov veliki ulog: Strojno učenje, umjetna inteligencija bit će njegov tajni umak, dobitna formula