Amazon AWS, analistlerin DataBrew ile sürükleyip bırakarak veri temizleme yapmasına olanak sağlamayı vaat ediyor

  • Sep 05, 2023

Mevcut Glue yazılımının bir uzantısı olan yeni program, veri bilimcileri gibi kodlayıcı olmayanların ve veri analistleri şablonları ve sürükleyip bırakmayı kullanarak veri hazırlama adımına katılıyor aktiviteler.

Amazon bugün duyuruldu Glue olarak bilinen veri temizleme programını, kodlayıcı olmayanların işini basitleştirmek amacıyla verileri hazırlamak için gerekli bazı adımları otomatikleştiren görsel bir kullanıcı arayüzü ile genişletti.

Özel özellik

Özel Rapor: Çoklu Bulutu Yönetmek (ücretsiz PDF)

Her zamankinden daha fazla şirket birden fazla bulut sağlayıcı kullanıyor. Bu özel raporda ZDNet, birden fazla bulutu yönetmeye yönelik en iyi uygulamaları ve çoklu bulut ortamını yönetmenize yardımcı olacak doğru satıcıları ve araçları seçmeye yönelik pratik tavsiyeler sunuyor.

Şimdi Oku

İsminde DataBrewprogram, veri analistlerinin ve veri bilimcilerinin ayıklama, dönüştürme, dönüştürme olarak bilinen adımları gerçekleştirmesine olanak tanır. ve herhangi bir verinin bir veri ambarında veya başka bir yerde analiz edilmesinden önce gerçekleşen yükleme veya ETL depo.

2016'da piyasaya sürülen Glue, mühendislerin bazı kodlamalarla ETL yapması için görsel bir araç iken DataBrew analistler içindir. ve veri bilimcileri, görsel bir kullanıcıdaki düğmelere tıklayarak ve radyal kutuları işaretleyerek aynı veri temizleme işlemi üzerinde çalışabilirler. arayüz.

AWS'nin tanımladığı gibi, hizmet "veri hazırlama görevlerini (ör. filtreleme) otomatikleştirmek için önceden oluşturulmuş 250 dönüşümden oluşuyor" anormallikler, formatların standartlaştırılması ve geçersiz değerlerin düzeltilmesi) aksi takdirde günlerce veya haftalarca elle kodlanmış yazım gerektirecek dönüşümler."

Bir tanıtım videosundaAWS, DataBrew programının örneğin veri analizinde kullanılamayan ve işareti gibi bir veritabanı girişindeki özel karakterleri nasıl kaldırabildiğini gösterir.

Benzer şekilde, bir "kategorik eşleme işlevi" kullanılarak girişlerin analiz edilebilir hale getirilmesi için bir metin dizesi sayısal değerlerle eşleştirilebilir.

Dolayısıyla, örneğin, "abone" veya "müşteri" girişlerini içeren bir "kullanıcı türü" sütunu, "1" ve "2" değerlerine tıklanarak eşleştirilebilir. kullanıcı arayüzündeki eşleme düğmesi ve tüm karakterlere karşılık gelen 1 ve 2 değerlerine sahip yeni bir sütun üreten radyal düğmeye tıklamak girdileri.

Profil oluşturma işlevi, veri kümesindeki eksik girişlerin sayısı gibi veri kümesiyle ilgili istatistikler sunar.

Amazon girişiminin Talend gibi veri temizleme konusunda uzmanlaşmış şirketler için yeni keşfedilen bir rekabet sağlayacağı tahmin ediliyor.

Amazon, aralarında Japon telekom devi NTT DoCoMo ve enerji devi BP plc'nin de bulunduğu bazı müşterilerinin halihazırda yazılımı kullandığını söyledi.

Daha fazla bilgi için ayrıca Glue DataBrew da bulunmaktadır. Ürünle ilgili blog girişi.