Големите данни променят играта за анализ на клиенти за Yammer, Spil Games, Jobrapido

  • Sep 05, 2023

Организациите разработват средства за разработване на много по-добри анализи за своите клиенти, като високоефективни и рентабилната обработка на големи данни позволяват стръмна крива на обучение от клиентите на техните желания и предпочитания.

Следващото издание на HP Discover Performance Подкаст поредицата предоставя дълбока представа за това как голяма информация променя играта около клиентския анализ.

Тази панелна дискусия за казус подчертава как различни организации измислят средства за далеч по-добро развитие анализи за своите клиенти. Научете как високопроизводителната и рентабилна обработка на големи данни дава възможност за стръмна крива на обучение от клиентите за техните желания и предпочитания.

Експертният състав се състои от Роб Уинтърс, директор „Отчитане и анализи“ в Игрални игри, базиран в Амстердам; Давиде Конфорти, директор Business Intelligence в Джобрапидо, със седалище в Милано; и Пийт Фишман, директор "Аналитика" в Yammer в Сан Франциско.

Дискусията, която се състоя на неотдавнашния

Конференция за големи данни на HP Vertica в Бостън, беше модериран от Дейна Гарднър, главен анализатор в Interarbor Solutions.

По-долу са някои откъси.

Различни проблеми

Бизнесът анализира своите клиенти от дълго време. Какво е различното сега?

Фишман: Ние сме а облак софтуерна услуга, а данните са големи. Нашите данни за клиентите вече са на едно централно място. Чрез обобщаване между компании, които използват вашия софтуер, можете да получите наистина значителни размери на извадката и реално заключение, както от икономически смисъл, по отношение на измерване на повдигането, но всъщност, тъй като размерите на извадката са толкова големи, можете да получите статистически изводи.

Това е отправната точка, за да направите анализите ценни и да научите за вашите клиенти.

Fishman_pete

Пийт Фишман

Изображение: LinkedIn

Зими: За мен проблемното пространство е изключително различно от това, с което се занимавах преди няколко години.

бях вътре телеком преди това. Там имате работа с 25 милиона души и ако ги оценявате отново веднъж месечно, това е достатъчно бързо. Що се отнася до проблем с уеб мащаб, имам работа с 200 милиона клиенти и трябва да ги преоценя в рамките на 10 или 15 минути. Така че улавяте значително повече данни. Разглеждаме милиарди записи на ден, влизащи в нашите системи. Трябва да го използваме възможно най-бързо, защото при онлайн изживяването на клиентите минутите са от значение.

Конфорти: При нас е абсолютно същата история. Сега имаме около 40 милиона уникални посетители на месец. Нараснахме с двуцифрено число от началото ни като стартираща компания през 2006 г. Сега всичко е свързано с взаимодействието с потребителите, как се държат нашите потребители на място и как можем да ги ангажираме повече на място и да им предоставим страхотни ad hoc потребителски изживявания.

Зими: Ние сме преди всичко платформа. Разработваме някои игри и публикуваме, но основният ни бизнес е просто платформата, където хората могат да дойдат и да намерят интересно за тях съдържание. Ние съществуваме от около девет години.

Започнахме просто като холандска компания [за игри] и след това придобихме други местни имена на домейни на различни езици. Към този момент имаме около 50 различни платформи, работещи на около 20 различни езика. Така че ние поддържаме клиенти от цял ​​свят. За даден месец имаме над 200 държави с трафик към нашите сайтове.

Целият бизнес се променя и вие се конкурирате въз основа на това клиентско изживяване, което можете да доставите. Имаме няколко целеви аудитории: момичета, млади момичета, 8-14; момчета; и след това жените.

Социални мрежи

Фишман: Yammer е стартираща компания в Сан Франциско. Бяхме придобити преди около година от Microsoft и ние сме част от по-голямото офис организация. Ние гледаме на себе си като на социално предприятие, като използваме този комуникационен модел много към много и правим комуникацията във вашата компания много по-ефективна.

Става дума за извличане на подходящи знания и експерти и за подобряване на работния живот. Аз управлявам екип за анализи там и ние основно разглеждаме съвкупното поведение на клиентите и какви части от нашия инструмент хората използват.

Това беше наистина революционна идея на нашите основатели Дейвид Сакс и Адам Пизони имаше, много назад, когато Facebook не беше толкова актуален, колкото е днес. Но ние използвахме голяма част от начина, по който хората са се научили да взаимодействат в социалния си живот и донесохме част от тази ефективност на комуникацията. Те видяха, че тези социални мрежи ще растат и ще бъдат подходящи в частен, защитен контекст на вашия бизнес.

Конфорти: Jobrapido стартира през 2006 г. като предприемаческо предизвикателство, което Вито Ломеле, италианец, започнал в Милано. Доста предизвикателство е да живееш на онлайн пазара в Италия, защото обединяването на таланти не е толкова широко, колкото в САЩ или в други страни в Европа. Това, което правим, е да предоставим на търсещите работа възможност да намерят новата си работа.

Давиде Конфорти

Изображение: LinkedIn

Ние сме онлайн машина за търсене на работа и в момента работим в 58 различни държави с повече от 20 езика. Ние всички сме в тази голяма централа в Милано с много различни националности, защото, разбира се, ние предоставяме услугата на местните езици за повечето от нашите клиенти.

Наскоро бяхме закупени от Група Daily Mail, голяма медийна група, базирана в Лондон. За нас това е всичко - от сделки за наемане и задържане на търсещи работа и ангажиране с постоянно качество и потребителско изживяване на място. Ние използваме нашата голяма склад за данни за да разберем как по-добре да привличаме и задържаме клиенти въз основа на техните предпочитания. И също така го използваме, за да настроим нашия алгоритъм за съвпадение, който работи повече или по-малко като a Google алгоритъм.

Ние обхождаме много съдържание от различни източници, както бордове за работа, така и други сайтове за работа или директно в работните страници на отделни компании. Обединяваме ги в голяма база данни и, използвайки статистически инструменти, правим изводи какви класации желаят да видят нашите търсещи работа.

Така че това е доста тежко упражнение за обработка на данни, което правим всеки ден върху милиони и милиони различни спонсорирани или органични публикации.

Например, ако момчета от Yammer или момчета от Spil Games искат да наемат софтуерен инженер, те могат директно да популяризират своите спонсорирани реклами в Jobrapido, без да се налага да ги спонсорират в борда за работа. Така че ние се опитваме да обединим и опростим веригата за търсене на работа.

Големи данни

Какъв беше проблемът, който трябваше да разрешите, когато става въпрос за получаване на тези големи данни за анализ?

Зими: За мен предизвикателството беше многостранно. Как се справяте с този проблем с данните, с това разнообразие и обемна информация? Как да го представите по смислен начин за служители, които никога преди не са разглеждали данни, така че да могат да вземат добри решения по тях? И как да пуснете модели срещу него и да го върнете обратно в производствена среда толкова бързо, колкото възможно, за да можете да предоставите на тези клиенти по-добро изживяване, отколкото някога са получавали на вашия платформа?

Роб Уинтърс

Изображение: LinkedIn

Проблемът ми беше, че никой досега не се беше опитвал да го направи в моята компания. Влязохме на практика с чист лист. Но когато започнете да въвеждате различни източници на данни, започвате с всички неща, които знаете, че ще ви трябват веднага.

Започвате да виждате необходимите връзки за други източници на данни. В този момент изтегляме данни от хиляди бази данни, сливайки се с десетки интерфейси за програмиране на приложения (API). Вие изтегляте данните от вашия уеб журнал, за да можете да персонализирате за онези хора, които не ви дават информация за регистрация.

Когато за първи път започнахме да търсим устройство или приложение за съхранение на данни, ние работехме Postgres без индекси, само копия на производствени данни. За хората с данни това означава, че изпълнението на една заявка ще отнеме осем часа. Това е таблица от няколко милиона реда.

Знаехме, че е излязло типично базирано на ред решение. Така че започнахме да разглеждаме някои от другите приложения там. Големите са Терадата, Exadata, и Greenplum, но ще трябва да ипотекирате къщата на всеки служител в компанията, за да можете да си позволите лиценз за тези приложения, а ние сме доста малка компания. Така че те бяха излезли.

След това започнахме да разглеждаме някои от другите продавачи на бутици като Инфобрайт, и основно видяхме това с HP Вертика, можем да имаме относително ниско натоварване на нашите администратор на база данни (DBA), за да можем да се развиваме бързо без много поддръжка.

Ценовият модел отговаря на това, което трябва да постигнем, а производителността е толкова добра, че не е нужно да отделяме много време за оптимизация сега. По принцип можем да се движим много бързо по този път на превръщане в организация, управлявана от данни, без да се налага да се спираме при оптимизирането на индекса или да се опитваме да оптимизираме нашите заявки и пътища за пренаписване.

Можем просто да хвърлим много неща в системата, да я разбием заедно, да вземем резултатите и бързо да постигнем големи печалби за компанията.

Ние имаме център за данни, и ние правим всичко на нашите собствени частни сървъри. За нас следващата стъпка вероятно ще бъде преминаването към a частен облак модел и се надяваме, че Vertica ще работи и в тази среда.

Какъв беше вашият проблем с големите данни в Yammer и как го решихте?

Фишман: Нашият набор от проблеми беше, че имаше много хора, които се опитваха да влязат в корпоративното социално пространство. Появяват се много социални мрежи и по същество конкуренцията за внимание на работа е предизвикателство.

Смятахме, че данните са необходими, за да имаме конкурентно предимство. Дейвид Сакс и Адам Пизони имаха визия за разработване на компания за потребителски софтуер с бърза итерация. С тази бърза итерация получавате допълнително предимство, ако можете да се преориентирате въз основа на това коя част от продукта работи. Нашите проблеми с данните бяха до голяма степен свързани с превръщането на данните в конкурентно предимство в нашата методология за разработка.

Става дума за скорост

Какво беше във Vertica, което беше инструментално до момента, в който го възприехте? Дали това е проблем с паралелността, проблем с обема, скорост или всичко по-горе?

Фишман: Това е всичко по-горе, но истинският акцент винаги ще бъде относно скоростта, особено като се има предвид невероятна конкуренция за таланти, не само в района на залива, но навсякъде, особено в областта на данните.

Всеки, който има данни в заглавието си, е някой, който е много търсен. Тази способност за минимизиране на времената на цикъла за тези хора, които са такова предизвикателство да запазят и да се вълнуват от проекти, върху които работят и е страхотно решение, което им позволява да увеличат максимално собствените си способности, е наистина критичен. Същото е и в нашето пространство, и в разработката на софтуер като цяло.

Когато поемаме тези големи рискове и предизвикателства, способността много бързо да идентифицираме дали влизаме правилната посока и след това преориентирането накъде отиваме е наистина критично за съществуването на Yammer успешен.

Повишена производителност

Дейвид, как се справи с проблемите с данните?

Конфорти: Когато се присъединих към Jobrapido, вече имахме тонове A/B тестове, които са жизнената сила на нашата продуктова иновация. Искаме да тестваме всичко, от промяна на цвета или шрифта на един бутон до различно оформление, защото те имат огромно влияние върху подобряването на ангажираността на потребителите.

Преди използвахме Google Analytics инструменти, но не ни хареса много, защото това са примерни данни, така че едва ли достигате до статистически значими резултати. Решихме да изградим склад за данни, за да осигурим гъвкавост, производителност, както и по-високо ниво на контрол и съгласуваност на данните. Това е контрол от край до край от източника до визуализацията, за да ги направи по-ефективни по отношение на разработването на продукта.

С Vertica направихме точно това. Събрахме всички различни източници на данни в една кофа, организирахме я и сега имаме пълен контрол върху модела на данни. С моя екип управлявам тези модели на данни. Удивително е колко бързо можете да добавите парчета към пъзела или да премахнете други, които вече не са интересни, защото нашият бизнес модел, разбира се, е живо животно, живо същество.

Ние наистина ценим тази гъвкавост и високото ниво на контрол, което Vertica позволява. Това подобри много нашата пропускателна способност за иновации и ще я подобри още повече в бъдеще.

В момента стискаме на Vertica около 30 GB данни всеки ден (т.е. качваме 30 GB/ден на Vertica). Но ние ще го удвоим след няколко месеца, защото добавяме още неща. Искаме да знаем повече за моделите на кликване на нашите търсещи работа на сайта и това са масивни данни, които се вливат във Vertica. Също така нашето лицензиране в терабайти вероятно ще се удвои в бъдеще.

Друг труден факт, който мога да споделя с вас е, че всеки от вас, който използва Vertica, не трябва да е доволен от първото изпълнение на заявката. Ако можете да го оптимизирате, почти увеличавате ефективността на заявката с повече от 100 процента. Това е моят личен опит с консултанти или съветници. Vertica се радва да предостави подкрепата и това наистина добавя стойност.

Зими: Що се отнася до показателите за успех, когато се справяхме доказателство за концепция (POC), разгледахме главно производителността на заявките. В този момент не искахме да го използваме за прогнозиране и персонализиране, а само за анализи и отчитане.

Това, което видяхме, беше срещу индексирана база данни на Postgres. Бяхме направили известна оптимизация на данните. Нашите заявки се изпълняваха с повече от 1000 процента по-бързо и Vertica мащабираше доста линейно, докато с Postgres, когато поставим повече данни в таблиците, те просто започнаха да се задушават и просто умряха напълно.

За мен това ми позволи действително да си върша работата и екипът ми да върши работата си, което е доста голям показател за успех.

Другото нещо е, че със сравнително малък клъстер можем да поддържаме стотици хора и доклади, които имат директен достъп до базата данни, дузина анализатори или хора, които директно търсят информация от базата данни и всички наши дейности за персонализиране едновременно с минимална производителност хълцане. Това е голям показател за успех.

Разходи от край до край

Фишман: Имам подобни отзиви като Роб, което е сравнение с база данни на Postgres. Скоростите са поне един -- и вероятно по-близо до два или по-добре -- порядък по-високи. Със сигурност от страна на разходите е важно с данните да се вземе предвид целият разход. Така че това е нещо като тема.

Разнообразието от управление и извличане на полезни прозрения, които не са непременно в цената на стикера, има цена. Когато обмислят решение за данни, хората трябва да вземат предвид разходите от край до край. Каква е наистина цената на прозрения, за разлика от цената на терабайт или цената на както и да е.

Определено смятаме, че Vertica е най-доброто ни решение. Ние сме клиенти повече от три години. Така че това е доста дълга връзка. Не можех да си представя да се върна към многодневна заявка или нещо подобно.

Едно нещо, което Дейвид спомена е, че прогнозира колко данни ще постави във Vertica. Аз самият съм синоптик по професия. Още през 2010 г. правихме някои прогнози за това къде ще бъдем до края на 2011 г. по отношение на нашите обеми данни. Това е доста проста екстраполация и съм я сбъркал поне с един порядък.

Това, което открихме е, че когато започнете да получавате реална представа от данни, искате да получите малко повече, да ги съберете може би тук или там. Освен това, тъй като нашият продукт растеше, се сблъскахме с реален експоненциален растеж на данните и приехме умно решения за максимизиране на този показател, който ни интересува - цена на прозрения или минимизиране на разходите за прозрение.

Има много неща, които се случват едновременно. Така че препъването в наистина ценни прозрения може да се случи много по-лесно, отколкото когато сте по-наивни за това. По същество вие сте изправени пред насрещни ветрове в това. Намирането на прозрения става по-трудно. В същото време имате по-големи обеми от данни и някои икономии от мащаба. Така че има много неща, които си взаимодействат едновременно, но очевидно едно нещо, което може да намали този показател, са най-добрите в своята порода инструменти.

Разбира се, най-добре е да получите информация от хората, които могат да го използват, отколкото просто да търсите намаляване на разходите.

Фишман: Разбира се. Ако гледате на анализа като на разходен център, това е погрешно мнение. Тя трябва да бъде насочена към оптимизиране на потоците от приходи. Ние микрооптимизираме продукта, микрооптимизираме продажбите и маркетинга, бизнеса. Анализът е за подобряване на работата на всеки, предоставяне на данни, за да позволи на хората да бъдат по-ефективни.

Слушам към подкаст. Намерете го на iTunes. Прочетете а пълен препис или Изтегли копие.

Разкриване: HP е спонсор на BriefingsDirect подкасти.

Свързани истории:

  • Генералният мениджър на HP Vertica се взира в следващото поколение платформа за анализ Anywhere

  • Как MZI HealthCare идентифицира скъпоценни камъни за производителност на пациенти с големи данни с помощта на HP Vertica

  • Архитектурата HP Vertica дава масивен тласък на производителността при най-трудните BI запитвания за Infinity Insurance

  • Когато реалното време вече не е достатъчно добро, се появява предсказуемият бизнес

  • Резюме на подкаста: Експертите на HP анализират и обясняват новините за големите данни на HAVEn от HP Discover

  • Глобалният CISO на HP Брет Уолин за бъдещето на сигурността и риска

  • По-задълбоченото разузнаване, споделено широко чрез HP Vertica, събира скъпоценни камъни за анализи за стратегията на Guess за търговия на дребно

  • Докато Платформа 3.0 узрява, очаквайте гъвкав достъп, разпределение на приложима интелигентност в предприятието: панелът Open Group

  • Усъвършенстваният ИТ мониторинг осигурява фокус върху прогнозната диагностика на United Airlines

  • Конвергирани облачни новини от HP Discover: Какво означава това