MapR แบ่งระดับข้อมูลสำหรับไฮบริดคลาวด์โดยอัตโนมัติ

  • Oct 31, 2023

คุณลักษณะผลิตภัณฑ์ล่าสุดของ MapR จัดการกับปัญหาที่คุ้นเคยในการจัดการข้อมูลที่จะกลายเป็นอุปสรรคสำหรับผู้ที่ยอมรับระบบคลาวด์: คุณจะจัดระดับข้อมูลระหว่างคลัสเตอร์ในองค์กรและระบบคลาวด์ได้อย่างไร

mapr-โลโก้-wide3.png

แม้ว่าระบบคลาวด์จะรับประกันความเรียบง่ายในการดำเนินงานมากขึ้นสำหรับการดำเนินโครงการข้อมูลขนาดใหญ่ แต่ก็ไม่ได้หมายความว่าเป็นเช่นนั้น องค์กรต่างๆ สามารถหลีกเลี่ยงปัญหาด้านต้นทุนและการจัดการที่ต้องเผชิญกับการเริ่มต้นใช้งานแอปพลิเคชันและข้อมูลใหม่ๆ ชุด ในขณะที่ Ovum คาดว่าระบบคลาวด์จะคำนึงถึงการใช้งาน Big Data ส่วนใหญ่ภายในปี 2562 (ไม่ใช่ นานกว่าหนึ่งปีนับจากนี้) ซึ่งยังคงมีองค์กรจำนวนมากที่ต้องจัดการในสถานที่ และ การใช้งานระบบคลาวด์

แมพอาร์ ใหม่ ออร์บิท คลาวด์ สวีท กล่าวถึงองค์กรที่วางแผนจะจัดการหรือจัดระดับการจัดเก็บข้อมูลสำหรับการปรับใช้แบบไฮบริดในองค์กร/คลาวด์ รองรับการเคลื่อนย้ายข้อมูลแบบสองทางจากภายในองค์กรไปยังคลาวด์และด้านหลัง

MapR Orbit Suite ใช้ประโยชน์จากความสามารถเนมสเปซระดับโลกที่มีอยู่แล้วในระบบไฟล์ที่เป็นกรรมสิทธิ์ของ MapR (เมื่อเร็ว ๆ นี้ เปลี่ยนโฉมใหม่ MapR-XD) ในภาษาอังกฤษธรรมดา นั่นหมายความว่าคุณสามารถจัดเก็บข้อมูลเมตาได้แม้ว่าจะจัดเก็บไว้ในคลัสเตอร์ที่แยกจากกันก็ตาม นั่นเป็นความสามารถที่ Apache HDFS แบบโอเพ่นซอร์สขาด ข้อมูลเมตาสามารถครอบคลุมทุกอย่างตั้งแต่ชื่อไฟล์และ/หรือตาราง ชนิดข้อมูล สิทธิ์ด้านความปลอดภัย และอื่นๆ คุณลักษณะใหม่ของ Orbit Suite จะทำให้สิ่งที่ต้องใช้การเข้ารหัสด้วยตนเองที่ซับซ้อนก่อนหน้านี้เป็นไปโดยอัตโนมัติ

ด้วย Orbit Suite ใหม่ การจัดการข้อมูลเมตาจะขยายไปสู่ข้อมูลที่เก็บไว้ในระบบจัดเก็บข้อมูลบนคลาวด์ เริ่มแรก AWS S3 และ ที่เก็บข้อมูล Azure BLOB ได้รับการสนับสนุนด้วย ที่เก็บข้อมูลคลาวด์ของ Google ที่จะมาในภายหลัง นั่นนำไปสู่ความสามารถที่เป็นแก่นของความคลาสสิกมายาวนาน การจัดการวงจรชีวิตของข้อมูล: การจัดระดับการจัดเก็บ. การแบ่งระดับใช้สำหรับจัดเก็บข้อมูลในตำแหน่งที่คุ้มค่าที่สุด

ตามเนื้อผ้า สิ่งนี้อาจหมายถึงการย้ายข้อมูลอายุออกจากดิสก์ในเครื่องไปยังที่จัดเก็บข้อมูลถาวรแบบใกล้บรรทัดหรือออฟไลน์ที่มีความจุสูงกว่า แต่การจัดระดับพื้นที่จัดเก็บข้อมูลในปัจจุบันเป็นการดำเนินการสมดุลที่ซับซ้อนกว่ามาก เนื่องจากมีตัวเลือกใหม่ๆ มากมาย ระดับไฮเอนด์ ในหน่วยความจำ แฟลช SSD และ (เร็วๆ นี้) ที่เก็บข้อมูล NVRAM กำลังทำให้ประหยัดในการใช้ซิลิคอนสำหรับการใช้งานที่มีความต้องการสูง HDFS ของ Hadoop เพิ่มตัวเลือกสำหรับกรณีการใช้งานการเก็บถาวรที่ใช้งานอยู่ ซึ่งข้อมูลที่โดยปกติแล้วจะถูกกำจัดหรือ การแยกไฟล์เก็บถาวรจะถูกเก็บไว้เพื่อการวิเคราะห์ข้อมูลขนาดใหญ่ด้วยฮาร์ดแวร์สินค้าโภคภัณฑ์ที่ขยายขนาดออกและราคาถูก ดิสก์. ตอนนี้เพิ่มที่เก็บข้อมูลบนคลาวด์ลงในสมการ โดยให้ตัวเลือกที่ถูกกว่า HDFS ด้วยซ้ำ ก็เป็นสมการที่หลายๆอย่าง ลูกค้า Amazon EMR มักจะสร้างความสมดุล.

เมื่อคุณย้ายข้อมูลไปยังที่เก็บข้อมูลบนคลาวด์แล้ว Orbit Suite ใหม่ยังช่วยให้คุณสามารถจัดเตรียมการประมวลผลได้อีกด้วย คลัสเตอร์รวมถึงการใช้ API ดั้งเดิม เริ่มแรกสำหรับ AWS และ Azure โดยจะรองรับ Google Cloud ในอนาคต ภายหลัง. เป็นตัวเลือกแยกต่างหากสำหรับลูกค้าที่ต้องการย้ายข้อมูลไปยังพื้นที่จัดเก็บข้อมูลที่ถูกกว่า แต่ยังไม่จำเป็นต้องหมุนการประมวลผล นอกจากนี้ ข้อเสนอ Orbit Suite ใหม่ยังนำเสนอการประมวลผลล่วงหน้า Edge IoT ของ MapR ด้วยการเพิ่มตัวเลือกในการย้ายข้อมูลแบบเรียลไทม์ไปยังคลาวด์ ไม่ใช่แค่ไปยังคลัสเตอร์ในสถานที่เท่านั้น

บริการคลาวด์ที่มีการจัดการควรจะให้ความเรียบง่ายในการปฏิบัติงาน แต่ตัวเลือกที่หลากหลายที่พวกเขานำเสนอจะโยนตัวเลือกและความซับซ้อนใหม่ๆ เข้ามาผสมผสาน ด้วยข้อเสนอ Orbit Suite ใหม่ MapR กำลังจัดการกับสิ่งที่จะกลายเป็นหนึ่งในปัญหาอื่น ๆ สำหรับผู้ที่ใช้กลยุทธ์คลาวด์แบบไฮบริด