Amazon AWS สัญญาว่าจะให้นักวิเคราะห์ทำการล้างข้อมูลแบบลากและวางด้วย DataBrew

  • Sep 05, 2023

โปรแกรมใหม่นี้เป็นส่วนขยายจากซอฟต์แวร์ Glue ที่มีอยู่ ช่วยให้ผู้ที่ไม่ใช่ผู้เขียนโค้ด เช่น นักวิทยาศาสตร์ข้อมูล และนักวิเคราะห์ข้อมูลมีส่วนร่วมในขั้นตอนการเตรียมข้อมูลโดยใช้เทมเพลตและการลากและวาง กิจกรรม.

อเมซอนวันนี้ ประกาศแล้ว ได้ขยายโปรแกรมสำหรับการล้างข้อมูลที่เรียกว่า Glue ด้วยอินเทอร์เฟซผู้ใช้แบบภาพที่ทำให้ขั้นตอนที่จำเป็นในการเตรียมข้อมูลเป็นไปโดยอัตโนมัติ เพื่อลดความซับซ้อนของงานสำหรับผู้ที่ไม่ใช่ผู้เขียนโค้ด

คุณสมบัติพิเศษ

รายงานพิเศษ: การจัดการ Multicloud (PDF ฟรี)

บริษัทต่างๆ จำนวนมากกว่าที่เคยใช้ผู้ให้บริการระบบคลาวด์หลายราย ในรายงานพิเศษนี้ ZDNet นำเสนอแนวปฏิบัติที่ดีที่สุดสำหรับการจัดการหลายคลาวด์ และคำแนะนำเชิงปฏิบัติสำหรับการเลือกผู้จำหน่ายและเครื่องมือที่เหมาะสมเพื่อช่วยคุณจัดการสภาพแวดล้อมมัลติคลาวด์

อ่านตอนนี้

เรียกว่า ดาต้าบรูว์โปรแกรมนี้ช่วยให้นักวิเคราะห์ข้อมูลและนักวิทยาศาสตร์ข้อมูลดำเนินการขั้นตอนที่เรียกว่าแยก แปลง แปลง และโหลดหรือ ETL ซึ่งเกิดขึ้นก่อนที่จะวิเคราะห์ข้อมูลในคลังข้อมูลหรือที่อื่นได้ พื้นที่เก็บข้อมูล

ในขณะที่ Glue ซึ่งเปิดตัวในปี 2559 เป็นเครื่องมือภาพสำหรับวิศวกรในการทำ ETL โดยมีการเขียนโค้ดบางส่วนเกี่ยวข้อง DataBrew มีไว้สำหรับนักวิเคราะห์ และนักวิทยาศาสตร์ข้อมูลเพื่อดำเนินการล้างข้อมูลเดียวกันโดยเพียงคลิกปุ่มและทำเครื่องหมายที่กล่องรัศมีในผู้ใช้แบบภาพ อินเตอร์เฟซ.

ดังที่ AWS อธิบายบริการนี้ ซึ่งประกอบด้วย "การแปลงที่สร้างไว้ล่วงหน้า 250 รายการเพื่อเตรียมงานเตรียมข้อมูลอัตโนมัติ (เช่น การกรอง ความผิดปกติ การกำหนดรูปแบบมาตรฐาน และการแก้ไขค่าที่ไม่ถูกต้อง) ซึ่งอาจต้องใช้เวลาหลายวันหรือหลายสัปดาห์ในการเขียนโค้ดด้วยมือ การเปลี่ยนแปลง”

ในวิดีโอสาธิต, AWS แสดงให้เห็นว่าโปรแกรม DataBrew สามารถลบอักขระพิเศษในรายการฐานข้อมูล เช่น เครื่องหมายแอมเปอร์แซนด์ ซึ่งไม่สามารถใช้ในการวิเคราะห์ข้อมูลได้อย่างไร

ในทำนองเดียวกัน สตริงข้อความสามารถแมปกับค่าตัวเลขเพื่อให้สามารถวิเคราะห์รายการได้ โดยใช้ "ฟังก์ชันการแมปหมวดหมู่"

ตัวอย่างเช่น คอลัมน์ "ประเภทผู้ใช้" ที่มีรายการ "สมาชิก" หรือ "ลูกค้า" สามารถแมปกับค่า "1" และ "2" ได้โดยการคลิกปุ่ม ปุ่มการแมปในส่วนต่อประสานผู้ใช้ และการคลิกปุ่มรัศมีซึ่งสร้างคอลัมน์ใหม่ที่มีค่า 1 และ 2 ที่สอดคล้องกับอักขระทั้งหมด รายการ.

ฟังก์ชันการทำโปรไฟล์นำเสนอสถิติเกี่ยวกับชุดข้อมูล เช่น จำนวนรายการที่ขาดหายไปในชุดข้อมูล

โครงการริเริ่มของ Amazon น่าจะเป็นการแข่งขันครั้งใหม่สำหรับบริษัทที่เชี่ยวชาญด้านการล้างข้อมูล เช่น Talend

Amazon กล่าวว่ามีลูกค้าบางรายที่ใช้ซอฟต์แวร์นี้แล้ว รวมถึง NTT DoCoMo ยักษ์ใหญ่ด้านโทรคมนาคมของญี่ปุ่น และ bp plc ยักษ์ใหญ่ด้านพลังงาน

หากต้องการข้อมูลเพิ่มเติม ยังมี Glue DataBrew อีกด้วย รายการบล็อกเกี่ยวกับผลิตภัณฑ์