Klausimai ir atsakymai: Gurjeet Singh, Ayasdi įkūrėjas ir generalinis direktorius

  • Oct 29, 2023

Mašininio mokymosi įmonė banke turi 30,6 mln. USD ir jos tikslas yra pakeisti įmonių požiūrį į savo duomenis. Kalbamės su jos vadovu.

gurjeet-singh-ayasdi-620px

Vakar pranešėme, kad Ayasdi, startuolis, įsikūręs Palo Alto mieste, Kalifornijoje, surinko 30,6 mln. USD iš investuotojų grupės („General Electric“, „Citi“) skirta technologijai, kuri nauju būdu priartėja prie sudėtingų duomenų rinkinių, kad įmonės galėtų geriau veikti efektyviai.

Jums bus sunku rasti madingą žodį „didieji duomenys“ bendrovės interneto svetainėje, nors. Šį terminą įsakė įmonės, žadančios greičiau pateikti užklausas dėl didžiulių duomenų rinkinių, nebūtinai keisdamos pagrindinį požiūrį. Ayasdi nuomone, tai yra „dideli duomenys“, tačiau taip išvengiama tikrosios problemos sprendimo. Svarbu ne priemonės, o galutinis rezultatas.

Bendrovė teigia, kad jos technologija gali rasti atsakymus į klausimus, kurių tyrėjai nežinojo, kad jiems reikia užduoti. Štai kodėl startuolis surinko tiek daug pinigų, o didžiausi ekonomikos ramsčiai – nuo ​​farmacijos iki finansinių paslaugų – beldžiasi į duris.

Kalbėjomės su įkūrėju ir generaliniu direktoriumi Gurjeetu Singhu.

ZD: Papasakokite šiek tiek apie tai, kaip atsirado Ayasdi.

GS: Įkūrėme šią įmonę, nes manėme, kad ji viskam turės didžiulę įtaką.

Dar 2000 m., DARPA [JAV gynybos departamento tyrimų padalinys – Red.] ir NSF [Nacionalinis mokslo fondas, taip pat JAV vyriausybės agentūra – Red.] suprato, kad moksliniams tyrimams išleidžia šimtus milijonų dolerių. Tačiau žmonių mokslas pasikeitė. Jie kūrė didelius, sudėtingus duomenų rinkinius. Žmonės, kurie kūrė geriausius, sudėtingiausius duomenų rinkinius, tikriausiai nebuvo geriausi žmonės juos analizuoti. Biologai matematikos ir statistikos neišmano taip gerai, kaip matematikai ir statistikai.

Taigi jie pradėjo investuoti į šios problemos tyrimus. Jie turėjo viziją matyti, kad vis didėjant duomenų kiekiui, tyrimai taps sunkesni.

Mums pasisekė, nes dalyvavome programoje apie „topologinių duomenų analizę“. Per dešimtmetį paskelbėme daug straipsnių. Įrodėme, kad galime generuoti įžvalgas iš daugelio programų duomenų. 2008 m. buvome baigę tyrimą ir susidūrėme su tuo, ką daryti toliau. Taigi mes pradėjome Ayasdi. Jautėme, kad akademinėje bendruomenėje neturėsime tiek daug įtakos.

Kai pradėjome, mums pasisekė – kreipėmės dėl DARPA smulkaus verslo tyrimų stipendijos ir ją gavome. Mums labai pasisekė, kad gavome tą dotaciją. Mums prireikė dvejų metų, kol galėjome imtis šio tyrimo ir sukurti prototipą. Žinojome, kad prireiks daug laiko, kol sukursime tinkamą naudoti produktą; akademinėje bendruomenėje jūs nesijaudinate, kad sukursite produktą, kurį galėtų naudoti daug žmonių.

2010 m. turėjome labai ankstyvą prototipą, kurį galėjome pristatyti klientams ir parodyti, kaip jis veikia. Taigi mes paėmėme pradinį finansavimą iš Potvynis. Prekyba preke pradėjome 2012 m. sausio mėn., nors įmonėje neturėjome verslininkų. Remdamiesi ankstyvais pardavimais, surinkome daugiau finansavimo ir pradėjome statyti. Bendrovės veiklą viešai pradėjome sausio mėnesį.

Nuo to laiko mūsų telefonas nuolat skamba. Rinkoje yra didelė paklausa.

ZD: Ar anksti žinojote, kad jūsų tyrimams bus rinka?

GS: Dvejus metus mes neaugome. Kai turėjome prototipą, vienas iš mūsų patarėjų – [verslininkas] Steve'as Blankas; jis populiarus tarp taupių startuolių judėjimo – patarė eiti susitikti su įmonėmis ir gauti atsiliepimų. Taip ir darėme tris ar keturis mėnesius.

Priimtume bet kokį susitikimą su bet kuria įmone. Kiekvienas galėjo sugalvoti 10 skirtingų naudojimo atvejų [technologijai].

ZD: Kokie atsiliepimai jus labiausiai nustebino tuose ankstyvuose susitikimuose?

GS: Turėjome labai poliarizuojančią istoriją: žmonės tai visiškai suprastų arba visiškai nekentė. „Jūs sakote, kad mašina suras šią informaciją automatiškai? Esu išmokytas užduoti klausimus. Gerai, tai gal būt veikia su trimis jūsų pavyzdžiais, bet tai neveiks su mano sudėtinga tikrove." O kiti žmonės sakė: "O, taip. Leiskite savo programinei įrangai pasakyti, ko man trūksta."

ZD: Taigi buvo galima švietimo problema.

GS: Jautėme, kad bus didžiulė rinka, bet žinojome, kad reikės didžiulio išsilavinimo. Bet kuri ardoma technologija, kuri tapo įprasta, turėjo šią problemą. The vaikinas, kuris tai pasakė Pavyzdžiui, kiekvienuose namuose bus kompiuteris. Jei ketinate būti rinkos jėga, būsite skeptiškai nusiteikę. Taigi tai mus džiugino.

ZD: Daugelis startuolių išsprendžia siaurą problemą; jūsų technologija gali būti pritaikyta įvairiose pramonės šakose. Kaip jums, kaip pradedančiajam, sutelkti dėmesį, turėdamas tiek daug galimų programų?

GS: Tai nuolatinė problema. Didžiausia mano baimė, kai turime tokią horizontalią technologiją, yra mirti dėl krypties trūkumo. Mes to nenorime. Ar verta problemą spręsti? Klausiame savęs, ar problema pakankamai brangi. Jei duomenys brangūs, pavyzdžiui, naftos ir dujų – partijos surinkimas kainuoja daug, daug dolerių – mes tai darome.

Antra, ar yra nuolatinis naudojimas? Turite duomenų, naudokite juos vieną kartą ir viskas. Jei problema nepakartojama, mes jos nesprendžiame.

Mes sutelkiame dėmesį į penkis dalykus: viešąjį sektorių, vaistus (pvz., vaistų atradimą), naftą ir dujas (kurias žemės sklypus jie turėtų pirkti arba siūlyti kainą, gręžimo kryptį, mašinų priežiūrą, gamybą (numatomą techninę priežiūrą) ir finansines paslaugas (reguliacinius bandymus ir sukčiavimas).

Tačiau visi šie klientai naudoja tą patį produktą. Tikimės, kad ateityje turėsime specializuotis naudotojų patirtimi maždaug po metų. Bet ne pagrindinė technologija.

ZD: Nustatėme, kad įmonės mato daug jūsų technologijos potencialo. Kaip tai iš tikrųjų pakeis dalykus?

GS: Aš pasakysiu kai ką gana prieštaringo. Didieji duomenys, kaip šiandien supranta žmonės, yra tik didesnė mažų duomenų versija. Iš esmės tai, ką darome su duomenimis, nepasikeitė; tiesiog jo yra daugiau. Mes nekalbame apie naujos kategorijos problemų sprendimą. „Didieji duomenys“ iki šiol nebuvo veiksmingi sprendžiant šias problemas. Programinės įrangos ar kliento požiūriu tai reiškia, kad kažkas perka programinę įrangą, kuri apdoroja užklausas. Įvesties ir išvesties sistemos nepasikeitė. Tačiau pramonė vis tiek sugebėjo augti padarydama šias sistemas greitesnes – tai nėra nereikšminga! – tačiau tokia kryptis. Greičiau, daugiau duomenų, pigiau.

Pristatome esminį pokytį. Dabartinės sistemos prasideda nuo klausimo. Norint ką nors sužinoti iš savo duomenų, žmogus turi suformuoti hipotezę, kuri virsta užklausa, kuri tampa rezultatu. Problema ta, kad yra per daug užklausų ir per daug klausimų. Užklausų skaičius dideliame duomenų rinkinyje yra eksponentinis ir jis auga eksponentiškai. Kad ir kaip greitai sukurtumėte sistemą, niekada negalėsite gauti visos šios informacijos.

Mūsų sistema naudoja pažangią matematiką ir statistiką bei mašininį mokymąsi, kad automatiškai atrastų informaciją iš jūsų duomenų. Tai tik pasako atsakymus. Yra daug sričių, kuriose žinote, ką norite žinoti – pavyzdžiui, gamykloje norite sužinoti, kiek kilogramų ploviklio pagaminote per paskutinę valandą, kad žinotumėte, koks jūsų efektyvumas. Arba vaistų atradimo srityje: labai standartiniame duomenų rinkinyje bus dešimtys tūkstančių eilučių, o kiekviena eilutė yra paciento. O stulpelių yra milijonai.

Vis dar yra žmogus. Jūs tiesiog labai sustiprinate jų pastangas.

ZD: Kaip tai pristatote potencialiems klientams? Atsižvelgiant į tai, kad tai kitoks požiūris, nei jie tikisi.

GS: Mes nevartojame termino „didieji duomenys“ – nei mūsų svetainėje, nei su klientais. Tai pasakius, sukuriami lūkesčiai, neteisingi lūkesčiai. Svarbu ne duomenų dydis, o sudėtingumas. Farmacijos įmonės jums pasakys, kad jau 20 metų turi didelius duomenis.

Farmacijos įmonė šiandien išsiskiria tuo, kaip ji naudoja savo duomenis. Ne jos biologai ar įrenginiai. Jie myli [mūsų technologijas], jie supranta idėją, supranta, kad jos reikia.

Turėjome vieną patirtį – kalbėjomės su farmacijos įmone, vienas iš mūsų duomenų mokslininkų dalyvavo susitikime, o kambaryje buvo skeptikas. Jis davė mūsų duomenų mokslininkui duomenų rinkinį, kuriame 10 žmonių komanda jį tyrinėjo 11 mėnesių. Mūsų vaikinas galėjo atrasti viską, ką atrado per 11 mėnesių ir dar daugiau, per 20 minučių susitikime su žmonėmis. Nereikia nė sakyti, kad išpardavėme.

Yra pakankamai žmonių, kurie tuo tiki, bet vis tiek yra netikėjimo.

ZD: Kam šiose organizacijose parduodate?

GS: Farmacijos pramonėje yra franšizės vadovų. Naftos ir dujų srityje tai yra operacijų viceprezidentas. Finansinių paslaugų srityje mes parduodame įvairesniems [vadovams]. Apskritai mes neparduodame IT; parduodame verslui.

Viena iš pagrindinių mūsų įmonės idėjų yra ta, kad pasauliui reikia daugiau duomenų mokslininkų. Norėdami tapti vienu, turite suprasti matematiką, informatiką ir turėti srities patirties. Mūsų platforma sustiprina esamų duomenų mokslininkų pastangas ir paverčia domenų ekspertus tokiais pat efektyviais kaip duomenų mokslininkai. Dažniausiai šie žmonės yra verslo žmonės.

ZD: Ar duomenų mokslininkai tuo džiaugiasi?

GS: (juokiasi) Jie tuo džiaugiasi. Jie nuolat pervargsta. Per daug ką reikia padaryti. Ir kai kuriose organizacijose jie nėra vertinami.

Duomenų mokslininkai egzistavo ilgą laiką. Tiesiog dabar tai vadiname kitaip. Šių trijų įgūdžių sankirta egzistavo anksčiau. Kai juos samdome, žmonės, kuriuos samdome kaip duomenų mokslininkus, savęs taip nevadintų; jie turės bioinformatikos mokslų daktaro laipsnį ar panašiai.

ZD: Taigi, apie tą finansavimą.

G. S.: „Lians startup“ tikslas yra nemirti savęs badu. Turite būti moksliški ir išsiaiškinti, kur turite išleisti, prieš išleisdami. Buvome labai liekni, kol galėjome tiksliai suprasti, ko iš to norime.

Uždarėme labai didelius, labai reikšmingus sandorius su klientais ir turime didelį potencialių klientų srautą. Bet mes neturime pakankamai pardavėjų. Taigi pirmasis įsakymas yra gerokai išplėsti savo verslo operacijas. Antrasis segmentas, į kurį investuojame, yra platformos tobulinimas. Žvelgiant iš technologijų perspektyvos, mes esame labiau paskirstytoji skaičiavimo įmonė nei matematikos įmonė, ir vis dar daug investuojame į pagrindinę pagrindinę platformą. Mes nuolat pridedame prie sistemos daugiau algoritmų, keičiame jos mastelį, kad būtų galima apdoroti vis didesnius ir greitesnius duomenų rinkinius.

ZD: O tavo didžiausia problema?

GS: augimo valdymas.