Microsoft გამოავლენს Power BI-ისა და Azure Data Warehouse-ის ახალ შესაძლებლობებს

  • Sep 07, 2023

თავის Inspire პარტნიორთა კონფერენციაზე ლას ვეგასში, Microsoft აცხადებს წარმადობის დიდ გაუმჯობესებას თავის ღრუბლოვან მონაცემთა საწყობში და ახალი Enterprise/Big Data შესაძლებლობები Power BI-ისთვის.

დიდი რამდენიმე კვირა გავიდა მონაცემთა ბაზისა და ანალიტიკის სიახლეებისთვის Microsoft Azure ღრუბელზე. 27 ივნისს მაიკროსოფტს ჰქონდა სხვადასხვა განცხადებები Azure მონაცემთა შენახვისა და მონაცემთა ინტეგრაციის შესახებ. და, მხოლოდ ამ დილით, Snowflake-მა გამოაცხადა, რომ მისი მონაცემთა საწყობის სერვისი ახლა ზოგადად ხელმისაწვდომია Azure-ზე.

ასევე წაიკითხეთ: Snowflake-ის ღრუბლოვანი მონაცემთა საწყობი მოდის Microsoft Azure-ში

გააკეთეთ მონაცემთა შერწყმა
ახალი ამბები გრძელდება. დღეს, მის გააჩინე პარტნიორის კონფერენცია ლას ვეგასში, Microsoft-ს ჰქონდა მეტი მონაცემების შესახებ განცხადებები, საკუთარი მონაცემთა საწყობის სერვისისთვის Azure-ზე და მისი Power BI სერვისიც.

მონაცემთა საწყობის მხრივ, Microsoft-მა გამოაცხადა ახალი ფუნქცია, სახელწოდებით Instant Data Movement Azure SQL მონაცემთა საწყობი (SQL DW) სერვისი. მონაცემთა საწყობის პლატფორმები იძენენ სიჩქარეს მრავალი სერვერის ("კვანძების") ფედერაციით ერთ დიდ ლოგიკურ სერვერზე. რამდენადაც მოთხოვნები იწარმოება ამ ლოგიკური სერვერის წინააღმდეგ, მონაცემები ხშირად საჭიროებს გადაადგილებას კვანძებს შორის და სიჩქარე, რომლითაც მონაცემთა საწყობი ამას აკეთებს, გადამწყვეტია მისი მუშაობისთვის. SQL DW-მ უბრალოდ გააკეთა ასეთი ოპერაციები ბევრად უფრო სწრაფად.

პროდუქტმა გამოიყენა ფუნქცია სახელწოდებით Data Movement Service (DMS) ამ ამოცანის შესასრულებლად და ყოველთვის ასე იყო საკმაოდ კარგია, რადგან ის დაფუძნებულია გრძელვადიან ეფექტურ SQL Server ტექნოლოგიაზე, სახელწოდებით Bulk Copy Protocol (BCP). თუმცა, BCP-ის პრობლემა ის არის, რომ ის ახორციელებს ერთ ძაფზე, ერთ პროცესორის ბირთვზე, SQL Server-ის ერთი რიგის ოპერაციების რეჟიმის გამოყენებით.

მაგრამ SQL Server Gen2 შენახვის მომხმარებლებს ახლა შეუძლიათ ისარგებლონ Instant Data Movement-ით (IDM), რომელიც ახორციელებს რამდენიმე CPU ბირთვს და იყენებს SQL Server-ის უფრო ახალ პარტიულ რეჟიმს (ვექტორული დამუშავების საფუძველზე). შედეგი არის მონაცემთა ბევრად უფრო სწრაფი მოძრაობა და, შესაბამისად, შეკითხვის უკეთესი შესრულება, როდესაც მოთხოვნა უერთდება ცხრილებს სვეტების საფუძველზე, რომლებითაც ისინი ფიზიკურად არ არის მოწყობილი. სინამდვილეში, Microsoft ამბობს, რომ როდესაც შერწყმულია თავის ახალთან Azure დაჩქარებული ქსელი, SQL DW-ს შეუძლია მონაცემების გადატანა წამში 1 გბ-მდე სიჩქარით, კვანძზე.

ასევე წაიკითხეთ: Azure SQL მონაცემთა საწყობი "Gen 2": Microsoft-ის გასროლა Amazon-ის მშვილდის გასწვრივ

IDM-სა და მუშაობის გაუმჯობესებებს შორის SQL DW Gen2 შენახვისა და ქეშირება, Microsoft ძალიან დარწმუნებულია ამ პროდუქტის მუშაობაში. საკმარისად თავდაჯერებული, ფაქტობრივად, ანალიტიკოსთა ფირმა GigaOm Research-ის გაშვება დაავალა TPC-H ბენჩმარკები on SQL DW წინააღმდეგ Amazon Redshift, ერთი შეხედვით ძალიან დადებითი შედეგებით.

გამჟღავნება: მე თვითონ ვაკეთებ ანალიტიკოსს GigaOm Research-ისთვის. მე არ ვიყავი ჩართული SQL DW TPC-H საორიენტაციო პროექტში, თუმცა ვიცოდი, რომ ის ხორციელდებოდა.

Microsoft-ის დისკუსია TPC-H საორიენტაციო სამუშაოზე დაფარულია ა ბლოგის პოსტიდა GigaOm ანგარიში არის ხელმისაწვდომია ონლაინ როგორც

Power (up) BI
Power BI-ის მხრივ, Microsoft-მა გააუმჯობესა პოპულარული Business Intelligence სერვისი როგორც ღრუბლოვანი Big Data, ისე Enterprise ღერძებზე.

პირველისთვის, Microsoft-მა გააუმჯობესა Power Query თვითმომსახურების მონაცემთა მომზადების ინსტრუმენტი (რომელიც ასევე ჩართულია Windows-ის ვერსიაში Excel) Power BI ღრუბლოვან სერვისში შენახული მონაცემების დასამუშავებლად, ვიდრე მისი ფუნქციონირების შეზღუდვა დესკტოპზე შენახული Power BI მოდელებით.

იმის მიხედვით, თუ როგორ განხორციელდება Power Query-ის ღრუბლოვანი შესაძლებლობები, ის შეიძლება იყოს ძალიან საინტერესო აკომპანიმენტი Microsoft-ის Azure Data Factory სერვისი, რომლის ძირითადი გაუმჯობესებები იყო 27 ივნისის განცხადებების ნაწილი. გარდა ამისა, Power BI ინტეგრირებულია Azure Data Lake Storage Gen2 (ასევე გამოცხადდა 27 ივნისს და ამჟამად გადახედვისას), გაფართოება Azure Blob Storage რაც გამორიცხავს ფაილის ზომის შეზღუდვებს და ამატებს წვდომის ინტერფეისს, რაც მას თავსებადია Hadoop განაწილებული ფაილური სისტემა (HDFS), დიდი მონაცემთა შენახვის კანონიკური ტექნოლოგია.

Power BI დაფუძნებულია Microsoft-ის გრძელვადიან საქმიანობაზე SQL სერვერის ანალიზის სერვისები (SSAS) ტექნოლოგია და დღეიდან Power BI ახლა აერთიანებს SSAS-ის უამრავ ფუნქციას. ეს მოიცავს თავსებადობას XML ანალიზისთვის (XMLA), რომელიც არის SSAS-ის მშობლიური პროტოკოლი. XMLA თავსებადობას მოაქვს თავსებადობა SSAS-თან მუშაობისთვის შექმნილი ინსტრუმენტების მასივთან და Power BI-ს ბევრად უფრო Enterprise-ისთვის მზადყოფნას ხდის.

Power BI ასევე იძენს ინტეგრაციას SQL Server Reporting Services (SSRS), Microsoft's Enterprise ანგარიშგების ტექნოლოგია. ახლა, Power BI ანგარიშებისა და დაფების გარდა, Power BI ღრუბლოვანი სერვისი შეძლებს SSRS ანგარიშების მასპინძლობას და გადაცემას.

ეს უზრუნველყოფს სასიამოვნო სიმეტრიას Power BI ანგარიშის სერვერი რომელიც თავისთავად წარმოადგენს SSRS-ის შიდა მოხსენების სერვერის სუპერკომპლექტს და რომელიც იძლევა Power BI ანგარიშების წინასწარ მიწოდების საშუალებას SSRS აქტივებთან ერთად. ახლა Microsoft-ის კლიენტებს შეეძლებათ SSRS და Power BI ანგარიშების მიღება, როგორც on-prem, ისე in-cloud გარემოში.

Enterprise-ის ოსტატობის გასაძლიერებლად, Power BI ახლა უზრუნველყოფს მხარდაჭერას Microsoft-ის საერთო მონაცემთა მოდელი (CDM) და ამატებს მრავალ გეო შესაბამისობას, რაც მომხმარებელს საშუალებას აძლევს განათავსონ Power BI Premium (არა პპროფესიული) კონკრეტულ გლობალურ რეგიონებში. ეს ხელს უწყობს მონაცემთა რეზიდენტობის მოთხოვნებთან შესაბამისობას, აძლიერებს მონაცემთა ლოკალიზაციას, რამაც შეიძლება შეამციროს მონაცემთა დატვირთვის დრო.

Microsoft-მა იცის, რომ ტექნოლოგია თითქმის ყოველთვის ჩართულია მონაცემებითა და ანალიტიკით და ის აორმაგებს თავის სხვადასხვა შეთავაზებას ამ არენაზე, განსაკუთრებით ღრუბელში. Microsoft-ის გამოწვევა ახლა არის დაარწმუნოს ბაზარი, რომ მას საუკეთესო შეუძლია ამაზონის ვებ სერვისები მონაცემთა სივრცეში. სანამ ის გზაშია, რედმონდს მეტი სამუშაო აქვს გასაკეთებელი, რათა მოიგოს ბაზრის გული და გონება მონაცემთა სეგმენტში.