Big Data's 2017: Може ли повече мета мислене да ни освободи от сегашното неразположение?

Ето обобщение на годишните прогнози от цялата индустрия за големи данни. Ключовите теми включват изкуствен интелект/машинно обучение, приемане на облак, търсене на специалисти по данни и нарастващото значение на Интернет на нещата.

ВИДЕО: Как големите данни ще променят живота ви през 2017 г

Всяка година широк набор от компании за големи данни ми изпращат прогнозите на своите ръководители за следващата година. Забавно е да ги съставите, след това да ги прочетете и да видите какво има да каже всеки. Има основа за подигравки, тъй като някои от прогнозите са в пълно противоречие помежду си и има достатъчно възможности за твърде уверен анализ, когато две или повече прогнози потвърждават всяка друго.

Извличане на прозрения
Това, което предпочитам обаче, е да търся теми, които свързват прогнозите заедно и предоставят някаква таксономия за разбиране на пълния им набор. По този начин дори тези елементи, които изглеждат противоречиви на повърхностно ниво, могат заедно да хвърлят светлина на по-дълбоко ниво и може да се появи някакъв консенсус. И дори консенсусните прогнози да се окажат неправилни, ние все пак получаваме съставна представа за това какво мислят лидерите в индустрията и какви тенденции вероятно ще доведат.

Вижте също

Силата на IoT и Big Data

Разглеждаме къде IoT ще има най-голямо въздействие и какво означава това за бъдещето на анализа на големи данни.

Прочетете сега

Тази година прогнозите говорят за прехода в индустрията, включително преминаването от чисто игрови анализи към повече приложни сценарии, особено по отношение на използването на Интернет на нещата, изкуствения интелект и машинното обучение случаи. Появява се въпросът за изолираните набори от умения и технология срещу интегриран подход, както и идеята за прилагане на аналитични технологии към самия анализ.

AI не е нещо ново
Нека започнем с изкуствения интелект (AI), който Джон Шрьодер, изпълнителен председател и основател на MapR Technologies, посочва, че е „отново на мода“. Въпреки че ИИ е съвременна сила, Шрьодер правилно отбелязва, че „през 60-те години Рей Соломонов полага основите на математическа теория за ИИ“ и че "през 1980 г. Първата национална конференция на Американската асоциация за изкуствен интелект (AAAI) се проведе в Станфорд и отбеляза приложението на теориите в софтуера."

Различното сега обаче е, че обемите от данни всъщност са много по-големи, което означава, че моделите са по-добре обучени и по-точни; алгоритмите също са по-добри и интересът на клиентите е с порядък по-висок от преди 30 години.

Може би затова Рик Фиц, старши вицепрезидент на ИТ пазарите в Splunk, казва, че 2017 г. ще бъде годината, в която „аналитиката става масова“, добавяйки, че „повече ИТ специалисти и инженери [ще разчитат] върху нововъзникващите технологии като машинно обучение, автоматизация и предсказуем анализ, за да извършват работа на по-високо ниво зад сцени."

Автоматизация и заетост
Означава ли това, че лошите машини ще отнемат работните места на хората - проблем, който очевидно е фактор в днешния политически пейзаж? Джо Корнгибел, старши вицепрезидент на потребителския опит в работен ден вижда нещата по следния начин: "Не, машините не поемат, но ние сме в критична точка на инфлексия."

Какво всъщност означава това? Вишал Авасти, главен технологичен директор в SAP партньор Dolphin Enterprise Solutions Corporation предвижда „елиминиране на рутинни задачи, които могат да бъдат делегирани на...ботове“, но Awasthi смекчава това, като казва, че работниците преди са се фокусирали върху такива задачи биха могли да „трансформират ролите си в работници на знанието, които се фокусират върху задачи, които все още могат да бъдат изпълнени само въз основа на общите интелигентност."

Може би това е в основата защо хората в интернет сайта за работа Наистина.com ми каза "сега виждаме, че обявите за работа с данни се покачват след повече от година спад." Освен това нарастващата зависимост от автоматизацията създава търсене на специалисти по сигурността на данните. Indeed.com казва, че „сигурността на данните остава най-важното за бизнеса и виждаме растеж на хокейния стик от 2013 г. насам“.

Машинно обучение, uber alles
Това наблюдение изглежда го потвърждава Пентахо Прогнозата на изпълнителния директор Куентин Галиван, че „Киберсигурността ще бъде най-известният случай на използване на големи данни“. Галиван също е в съгласие с машината учебен лагер, казвайки, че „през 2017 г. първите, които възприеха AI и машинното обучение в анализите, ще спечелят огромно предимство на първи в дигитализацията на бизнес."

Галиван също не вижда това като ограничено до няколко конкретни случая на употреба, добавяйки, че „това е също толкова вярно за онлайн търговеца, който иска да предложи по-добри препоръки на клиенти, за големи промишлени клиенти, които искат да минимизират големи разходи за поддръжка, за производители на самоуправляващи се автомобили или летище, което се стреми да предотврати следващия терорист атака."

AI, вътре
И така, къде ще живеят всички тези AI умници? Туфик Бубез, вицепрезидент по инженерството в Splunk, предвижда „прилагането на машинното обучение“, обяснявайки, че „възможностите за машинно обучение ще започнат да проникват корпоративните приложения и разширените приложения ще предоставят предложения - ако не и отговори - и предоставят интелигентни работни потоци, базирани на данни и потребител в реално време обратна връзка." Бубез продължава, като казва, че „това ще позволи на бизнес експертите да се възползват от персонализираното машинно обучение, без да е необходимо да бъдат експерти по машинно обучение."

Тази линия на мислене се засилва от Redis Labs' Вицепрезидент на продуктовия маркетинг Лийна Джоши, която вярва, че „Корпоративните приложения, които „учат“ бързо и персонализират потребителското изживяване, ще бъдат новата норма за успех.“ По същия начин, БашоИзпълнителният директор на Адам Рей вярва, че „организациите ще започнат да пренасочват по-голямата част от своите инвестиции към внедряване на решения, които позволяват използването на данни там, където са генериран и където се случва бизнес процес - на ръба." И докато този "ръб" може да се отнася за физически устройства, той може да се отнася и за линията на бизнеса приложения.

Учените по данни стават големи или се прибират?
Вграждането на интелигентност в масовия корпоративен софтуер загатва за друга ключова тема в тазгодишните прогнози: дали и до каква степен ще имаме нужда от специалисти по данни.

Оливър Робинсън, директор на Световно програмиране, казва, че „образователните курсове, насочени към кариери в областта на науката за данни, ще станат все по-популярни...“ и добавя, че „това ще помогне да се отговори на нарастващото търсене на учени/специалисти по данни в сферата на работа“. Джеф Катлин, главен изпълнителен директор на водещ доставчик на НЛП и анализ на настроението Лексалитика казва, че "2017 ще бъде" Годината на специалиста по данни ", но допълнително прогнозира това 2018 „когато AI ще може да се изгражда...от учени, които не се занимават с данни“.

Може би отивайки по-далеч, хората от DataStax казват, че „терминът „учен по данни“ ще стане по-малко уместен и ще бъде заменен от „инженери по данни“.“ И дори Робинсън от World Programming позволява облекчаване на титлата учен по данни, като се казва, че „Машинното обучение и изкуственият интелект също ще повишат нуждата от нови видове данни специалисти."

Към облака?
Независимо дали имаме нужда от специалисти, учени или просто от по-голяма аналитична грамотност сред работниците от всякакъв вид, възниква въпросът къде ще се прави анализът. Въпреки годините на шум около облака, изглежда, че повечето дейности с големи данни са били върху Hadoop клъстери, които са били инсталирани на място. Но мнозина в нашия факултет по прогнози настояват, че облакът е мястото, където вървят нещата и че дори най-консервативните организации ще възприемат поне хибриден подход.

Кунал Агарвал, главен изпълнителен директор на Unravel Data, прогнозира, че „през 2017 г. ще видим повече работни натоварвания с големи данни, които се преместват в облака, докато голям брой клиенти които традиционно са управлявали операциите си локално, ще преминат към хибриден облачен/локален модел." Дан Зомер, QlikСтарши директор на пазарното разузнаване, вярва, че „поради мястото, където се генерират данните, лекотата на започване и способността му за мащабиране, сега виждаме ускорено преминаване към облак“. И Снежинка изчисленияГлавният изпълнителен директор, Боб Мъглия, казва, че "почти всяка компания, включително повечето финансови услуги, сега се е ангажирала да приеме публичния облак."

Ерик Мизел, вицепрезидент, инженеринг на глобални решения в Кинетика вижда конвергенция на популярността на облака и ползата от машинното обучение, донесена от графичните процесори (GPU), заявявайки, че „облакът ще получи „турбо заредена“ производителност с графични процесори“, посочвайки, че „Amazon вече е започнал да внедрява графични процесори и Microsoft и Google обявиха планове" и прогнозираха, че "други доставчици на облачни услуги също могат да започнат да внедряват графични процесори през 2017 г."

IoT, на мястото, където трябва да бъде
Голяма част от необходимостта от тази допълнителна мощност на обработка идва от големия обем входни данни, събрани от сензори, вградени в устройства, предназначени за приложения на Интернет на нещата (IoT).

Мозъчният тръст при Analysys Mason Group вярва, че „първите наистина комерсиални NB [тяснолентови]-IoT мрежи ще бъдат пуснати“ през 2017 г. и че „регулаторите ще обмислят засилен надзор върху IoT“.

StreamSets Главният изпълнителен директор и основател, Гириш Панча, вярва, че през 2017 г. IoT ще престане да бъде лъскавото ново нещо и ще започне да става реално, като казва, че „следващата година организациите ще спре да поставя IoT данни на пиедестал или, ако желаете, в силоз." С други думи, IoT трябва да бъде интегриран с останалата част от жизнения цикъл на данните в организации. Панча уточнява: „Интернет на нещата данните трябва да бъдат свързани с други потоци от данни, обвързани с исторически или основни данни или преминаване през алгоритми с изкуствен интелект, за да осигури управление на бизнеса стойност."

На тази бележка, главният изпълнителен директор Анди Диринг, главен изпълнителен директор на Безграничен, компания, фокусирана върху технологията за географски информационни системи (GIS), вярва, че свързването на IoT потоци с базирани на местоположение данни ще бъде от изключително значение. Диринг прогнозира, че „базираните на местоположението анализи и платформи, които могат да обработват и откриват тенденции и да предоставят разузнавателна информация, ще се появят като популярна тенденция“.

Добавяйки специфика към тази прокламация, Диринг казва, че „със самоуправляващите се коли и инициативите за интелигентни градове стават повече от реалност, ще бъде наложително да се разбере как цялата информация за местоположението може да се използва, за да стане по-интелигентен решения."

Безкраен цикъл?
За да извлекат такава стойност от IoT данните, компаниите ще се нуждаят от компетентност в обработката на поточни данни. Ананд Венугопал, ръководител на продукта във for StreamAnalytix при Impetus Technologies казва, че „предприятията, използващи силата на анализа в реално време, ще станат по-чувствителни, гъвкави и да получат по-добро разбиране за нуждите и навиците на своите клиенти, за да осигурят цялостно по-добро опит."

Проблемът е, че простото поглъщане на данните не е достатъчно, защото тези данни трябва да бъдат почистени и подготвени по друг начин. Това изисква много работа, което означава, че потенциалът за нови технологични пробиви е смекчен със старите технологични реалности. Това прави ли анализа игра с нулева сума?

Пробийте
Галиван от Пентахо не мисли така, вярвайки вместо това, че пробивите могат решавам старите проблеми, вместо да се налага да бъдете затънали в тях. Неговото мнение: „Приемането на IoT и конвергенцията с големи данни ще направят автоматизиран изискване за въвеждане на данни." Казано по друг начин, моделите за машинно обучение ще трябва да бъдат използвани за подготовка на данни, преди да бъдат използвани за обучение на други модели за машинно обучение.

Това е доста трансцендентен анализ и, погледнато назад, доста ясен. В крайна сметка, как можем да кажем с право лице, че нашата технология променя играта, ако не я приложим, за да променим нашата собствена игра?

И светът ще бъде по-добро място
Светът на големите данни и анализите малко заседна през 2016 г. Надяваме се, че 2017 г. ще породи повече от "мета" мисленето, което Галиван използва тук. Това изглежда като билет за излизане от сегашното неразположение и към следващия етап на производителност и добросъвестна стойност за клиентите.

Въоръжени с този оптимизъм, можем да видим как управляваното от IoT AI/машинно обучение, работещо на базирани на облака графични процесори, вградено в корпоративни приложения и управлявано от хора, които не са учени по данни, може действително да работи. Да се надяваме, че 2017 е годината, в която ще се случи поне част от това.

Изграждането на лоялност на клиентите е свързано с данни: