Подорож Teradata в хмару

  • Oct 08, 2023

З Teradata, що перетворює Vantage на хмарну платформу, закладає основу для демократизації платформи за допомогою нових схем ціноутворення, які повною мірою використовують переваги еластичності хмари. Роблячи це, Teradata також сподівається розширити охоплення, націлившись на незадоволених користувачів Hadoop, але з повідомленням, яке може надто відволікати.

td-vantage.png

Терадата Цього року йому виповнилося 40 років, що помістило його в ряди невеликої групи відомих ІТ-імен, таких як IBM, SAS і Oracle, які або народилися, або (у випадку IBM) пережили зло поліестеру та диско. Коли компанія була заснована, поняття терабайт даних було практично неможливо уявити. На щастя, коли хтось виставив слайд, який показує, як межі пам’яті перейшли від терабайтів до гігабайтів, petabyte і zetabyte, ми зітхнули з полегшенням, що Teradata не відчуває потреби змінювати свою назву, щоб зберегти поточний.

Підводячи підсумок, Ларрі Дігнан резюмував заголовки із щорічного заходу Teradata Universe минулого тижня, головним моментом якого є те, що Teradata використовує хмарну архітектуру та бізнес-модель.

Терадата щойно побачив значну зміну караулу, відзначену сходженням на початку цього року Олівер Ратцесбергер на посаді генерального директора, а також значні зміни в решті програмного забезпечення C. Для нас важливо те, що це вперше за десятиліття, коли Teradata очолив технолог, а не бізнесмен.

Ми почнемо з факту, який не змінився. Teradata визначає свій адресний ринок як «компанії мегаданих», тобто організації з найскладнішими аналітичними проблемами через складність і масштаб. Іншими словами, він не конкурує зі світовими MySQL, PostgreSQL, Redshift або Snowflakes за ширший ринок вітрин даних середнього розміру для сховищ даних. Це ставить Teradata на курс зіткнення з Клаудера. Тримай цю думку.

Інша річ, яка не змінилася, це спроби компанії відмовитися від апаратного забезпечення – це повідомлення, що зростав і слабшав за роки, відколи Teradata вперше представила свої платформи «відкритих систем» ще в 1990-ті роки. Досі це було важко продати, тому що типи робочих навантажень, у яких Teradata перевершує – надзвичайно складний SQL із численними об’єднання даних обсягом до терабайт (або більше) і з підтримкою дуже високого паралелізму – потрібна спеціальна оптимізація обладнання.

Раніше Teradata продавала спеціалізовані пристрої, призначені для різних робочих навантажень: інтенсивних обчислень, інтенсивних IOPS та/або високого паралелізму. З фірмовим обладнанням останнього покоління IntelliFlex, ці варіації можна налаштувати за допомогою програмного забезпечення. Існують специфічні функції Teradata, як-от з’єднання Bynet, але з такими тенденціями, як швидший Ethernet, ми очікуємо, що ігрове поле з стандартним обладнанням зрештою вирівняється.

Але ще краща новина полягає в тому, що хмара може нарешті зробити всю проблему академічною: раз і назавжди вирішіть, що Teradata є програмною компанією. І ось тут починається цьогорічний розділ у мандрівці. Хмарна рідна архітектура платформи Teradata, яка тепер називається Перевага, відокремлює дані від обчислень і пропонує вбудовану підтримку зберігання об’єктів як ще один рівень. Teradata — навряд чи єдиний гравець, який використовує хмарну архітектуру. Насправді ми щойно говорили SAP робить таку ж зміну з HANA. І, до речі, Cloudera і Hadoop також. Як ми вже зазначали раніше, хмарне сховище об’єктів стає де-факто озеро даних.

І завдяки тому, що обчислення та сховище розділені, це розчищає шлях для Teradata, щоб почати пропонувати ціноутворення на основі споживання. Отже, якщо ви використовуєте керовану хмарну службу Teradata, більше нічого складного Ціни Tcore; натомість ви платите так само, як за будь-яку хмарну службу; за обсягом пам’яті, а потім лише за об’єктом, який ви використовуєте. Це важливий крок до того, щоб полегшити ведення бізнесу з Teradata, а запровадження розрахункової системи ціноутворення зробить послугу набагато доступнішою.

Ми зробимо цей крок далі. Частиною поточного випуску Vantage є підтримка контейнеризації. Наступним логічним кроком стане розширення підтримки Kubernetes. Для Teradata це відкриє шлях до створення та потенційного керування приватними хмарами для клієнтів, які сумніваються щодо переміщення своїх робочих навантажень у публічну хмару. Ми не здивуємося, якщо наступного року Teradata додасть підтримку Kubernetes.

За цими подіями стоїть, як зазначалося вище, зростаючий паритет товарного обладнання. Але це також говорить про зростаючу різноманітність прикладів хмарних обчислень. Наприклад, на AWS ви можете зараз вибрати з портфоліо екземплярів EC2, оптимізованих для обчислень, пам’яті, високошвидкісної обробки або зберігання – як і в минулі часи, ви обираєте пристрої від Teradata, оптимізовані для обчислень, IOPS або змішаних робочі навантаження. У вас також є різноманітність параметри зберігання. Тим часом постачальники хмарних послуг додають спеціалізовані процесори, призначені для конкретних робочих навантажень, наприклад ТПУ оптимізовано для робочих навантажень TensorFlow у Google Cloud. Завершуючи угоду, об’єднавчі панелі постачальників хмарних послуг стають достатньо швидкими, щоб запропонувати «достатньо хороші» альтернативи оптимізованій інфраструктурі традиційних пристроїв Teradata.

Іншою ключовою тенденцією є позиціонування Vantage як, по суті, багатофункціональної платформи. І, як зазначалося вище, саме тут він стикається з Hadoop. Ключ до розвитку Vantage полягає в тому, що це плід Платформа Aster Data Discovery. У той час Teradata тримала платформу Aster окремо від материнського корабля, націлюючи її на організації, що працюють з аналітикою великих даних. Результатом стала плутанина в базі Терадата щодо того, чи стане Aster стратегічним чи приватним. Внесок Астер був сотні бібліотек який розширив SQL для підтримки таких підходів, як MapReduce, графіки, машинне навчання та програмування R і Python. Без Aster платформа Vantage не була б такою гарною.

Звичайно, Teradata не єдина, хто робить реляційну базу даних більш розширюваною. Хоча традиційно, Загальна практика видобував дані або таблиці на ноутбук, а потім переглядав і аналізував дані в таких структурах Оскільки Pandas, постачальники баз даних дедалі частіше переносять обробку R і Python безпосередньо в бази даних. Перевагою є усунення необхідності копіювання даних (і отримання кількох версій істини), не кажучи вже про використання переваг власних механізмів виконання бази даних для масштабування роботи моделі.

сьогодні, Microsoft підтримує обробку Python і R у базі даних із SQL Server 2019 за допомогою визначених користувачем функцій; Зараз Oracle додає R і Python API для запуску моделей у базі даних; поки IBM підтримує запуск Go, Ruby, Python, PHP, Java, Node.js і Sequelize серед інших мов у Db2. Можливість використовувати блокноти Jupyter для розробки та розгортання моделей для запуску в базі даних також стала націленою. Диференціатор Teradata пропонує багате портфоліо аналітичних бібліотек, оптимізованих для бази даних.

У результаті Teradata вважає, що має більш надійну альтернативу для організацій, які мають проблеми з Hadoop. Він оголосив про програму міграції Hadoop, яка включає багатоетапну участь у оцінці, плануванні та реалізації. Він з’являється разом із просуванням «реляційних озер даних» такими компаніями, як SAP. Керівна ідея полягає в тому, що, враховуючи велику існуючу базу навичок розробників SQL, зробити SQL розширюваним для підтримки деяких з нові підходи до програмної аналітики будуть більш практичними для організацій, які не мають відповідних навичок у Python або Р. Не дивно, що імпровізована виставкова сесія, на якій було представлено нову програму міграції Hadoop, зібрала натовп лише стоячи.

І це сталося після кризи середнього віку Hadoop, яка сталася злиття Cloudera і Hortonworks, і Придбання MapR компанією HPE у зв’язку з розпродажем. Стало модно засуджувати Hadoop як мертвий, і, на жаль, Teradata була непослідовною у своїх повідомленнях про Hadoop. На деяких слайдах Hadoop називають «вмираючою технологією». Тим не менш, його практики на місцях визнати, що Hadoop продовжить відігравати важливу роль, і, до речі, Teradata все ще має партнерство з Клаудерою. Teradata має очистити обмін повідомленнями Hadoop і бути більш позитивним. Реляційні озера даних добре підходять для організацій, де переважають навички SQL. Поки Teradata позиціонує міграцію Hadoop як краще відповідну набору навичок її клієнтської бази, який повинен уникати непотрібного шуму та відволікання, які створюють його непослідовні повідомлення шлях.