Dideli duomenys: kita didelė Facebook idėja

  • Oct 29, 2023

„Facebook“ klaida yra ta, kad socialinis tinklas iš tikrųjų yra reklamos įmonė. Problema ta, kad „patinka“ nereiškia „pirkti“.

fb-big-data

„Facebook“ klaida yra ta, kad socialinis tinklas iš tikrųjų yra reklamos įmonė.

Jei pažvelgsite į jų ketvirtinę ataskaitą, pamatysite, kad apie 82% jų pajamų gaunama iš reklamos, taigi tai patvirtina šį teiginį. Problema ta, kad „patinka“ kažkas nėra gerai išverčiama į „pirkti“.

Galbūt prisimenate, kad dėl to GM neseniai pasitraukė iš „Facebook“ reklamuotojo. Kita vertus, paieškų derinimas su skelbimais, kad galėtumėte nukreipti skelbimus į produktus, kuriuos galbūt domintų pirkti, yra patikrintas būdas ir yra „Google“ stiprybė.

Kai galvojame apie tradicinę žiniatinklio reklamos įmonę, labiausiai į galvą ateina „Google“. Jei palyginsime „Google“ su „Facebook“ kainos ir pajamų (P/E) santykiu, pamatysime didelį atotrūkį.

Greitas nukrypimas į finansus: P/E koeficientas yra dabartinės bendrovės akcijų kainos vertinimo koeficientas, palyginti su jos pajamu vienai akcijai.

Naudodami „Google“ kaip pavyzdį matome, kad šiandien jo santykis yra 18,88. Taip yra todėl, kad „Google“ šiuo metu prekiauja 636,69 USD už akciją, o pelnas per pastaruosius 12 mėnesių buvo 33,72 USD už akciją, taigi „Google“ P/E santykis būtų 18,88 (636,69 USD / 33,72 USD).

Birželio mėnesį „Google“ P/E santykis buvo maždaug 11, o „Facebook“ prekiavo 40 kartų daugiau nei tikėtasi. Taigi, atjungimas.

„Kasdienė ir užsispyrusi realybė kiekvienam, kuriančio verslą pasitelkus žiniatinklio reklamą, yra Skaitmeninių skelbimų vertė mažėja kas ketvirtį, dėl jų vienu metu neefektyvumo ir efektyvumas“, pagal Michaelas Wolffas.

Jei Michaelas Wolffas yra teisus, „Facebook“ reikės kažko daugiau nei reklama, kad atsilaikytų ir įveiktų ažiotažą. „Facebook“ reikia „didelės idėjos“.

955 milijonai „Facebook“ vartotojų, kurių kiek daugiau nei pusė tiek aktyviai naudojasi „Facebook“ kasdien, sukuria milžinišką duomenų kiekį. Apskaičiuota, kad „Facebook“ duomenų dydis yra maždaug 100 petabaitų pateikė Sameet Agarwal, „Facebook“ inžinerijos direktorius, cituojamas MIT Technologijų apžvalga. „Per pastaruosius kelerius metus mūsų dydis kasmet padidėjo daugiau nei dvigubai.

Didžioji dalis šių duomenų yra vienoje „Hadoop“ parduotuvėje, kurioje, tinkamai išgaunant, galima pakeisti mūsų supratimą apie žmonių sąveiką ir galiausiai apie tai, kaip veikia visuomenė. Tai galėtų būti kita didelė Facebook idėja.

Bet kaip jį išgauti?

Turėdamas daugiau nei 100 petabaitų vartotojų duomenų, kurie kasdien auga, „Facebook“ sukūrė duomenų saugojimo sistemą „Hadoop“. The Apache Hadoop Projektas buvo skirtas sukurti atvirojo kodo programinę įrangą, skirtą patikimam, keičiamo dydžio, paskirstytam kompiuterijai.

„Hadoop“ iš tikrųjų yra didelių duomenų rinkinių procesų paskirstymo daugelyje kompiuterių sistema. Idėja yra turėti galimybę išplėsti mastelį nuo vieno serverio iki tūkstančių paskirstytų serverių, suteikiant labai keičiamo dydžio ir labai prieinamą didelių duomenų problemų sprendimą.

Nors programavimo modelis turėjo būti paprastas, jo raida pasirodė gana sudėtinga, bent jau to, ko reikėjo „Facebook“. Jei „Facebook“ „didžioji idėja“ kiltų iš duomenų tyrimo, jie turėtų pritaikyti „Hadoop“ prie duomenų mokslo palaikymo.

Dirbdama su žmonėmis iš „Cloudera“, „Hortonworks“ ir kitų, „Facebook“ ėmėsi kurti Avilys, duomenų saugyklos sistema, skirta Hadoop. „Hive“ leidžia „Facebook Data Sciences Team“, 12 tyrėjų grupei, pritaikyti socialines paslaugas mokslo tyrimų metodus, sukurti specialias užklausas ir atlikti įvairią didelių duomenų rinkinių, saugomų Hadoop.

„Hive“ projektas suteikia duomenų mokslo komandai mechanizmą, leidžiantį projektuoti šių duomenų struktūrą ir pateikti duomenų užklausą naudojant į SQL panašią kalbą (HiveQL); taigi, leidžiant jiems išgauti „Facebook“ duomenis.

„Vienas iš galimų Facebook duomenų saugyklos panaudojimo būdų būtų parduoti iš jos gautas įžvalgas. Tokia informacija galėtų būti beveik bet kokio verslo pagrindas. Darant prielaidą, kad „Facebook“ gali tai padaryti nenuliūdindamas vartotojų ir reguliavimo institucijų, tai gali būti pelninga., pagal DJ Patil, duomenų mokslininkas, gyvenantis Greylock Partners.

Šiuo metu pasirodė įdomių duomenų fragmentų, tačiau kol kas nėra „didelių idėjų“.

Kaip manote, ką jie gali rasti išgavę mūsų duomenis?