بالنسبة لـ CockroachDB، تعتبر المعاملات أولاً، ثم التحليلات ميزة - وليست خطأً

  • Aug 31, 2023

قاعدة بيانات مفتوحة المصدر تتسم بالمرونة، وتدعم التوسع الجغرافي التلقائي داخل المؤسسة وفي السحابة، وSQL. CockroachDB هو كل ذلك بالفعل. التالي في خريطة الطريق: التحليلات، مع المعالجة التحليلية للمعاملات المختلطة.

متميز

  • لماذا لا يستخدم المزيد من الأشخاص نظام التشغيل Linux لسطح المكتب؟ لدي نظرية قد لا تعجبك
  • لا تحتاج في الأساس إلى شحن ساعة Garmin الذكية هذه
  • 3 أدوات Windows الأساسية لاستكشاف الأخطاء وإصلاحها (وكيفية استخدامها)
  • العودة إلى المدرسة؟ هذه هي أفضل العروض للطلاب لتوفير المال على التكنولوجيا

قواعد البيانات السحابية الأصلية. قواعد بيانات بدون خادم. مهما كان الاسم الذي تريد تسميته، هناك جيل جديد من قواعد البيانات آخذ في الارتفاع. واحدة تعد بقابلية التوسع التلقائي على نطاق عالمي: لا مزيد من الكدح في التكوين والإدارة والنسخ وما شابه، ما عليك سوى تدوير بعض المثيلات في السحابة والانطلاق.

أيضًا: رقائق الذكاء الاصطناعي مفتوحة المصدر تصنع الأمواج الخضراء: جلب كفاءة الطاقة إلى بنية إنترنت الأشياء

لكن أيضا تنجذب البيانات بشكل طبيعي إلى السحابة، ليس الجميع مستعدًا وقادرًا على نقل جميع البيانات إلى هناك. لذلك، من المتوقع بشكل متزايد أيضًا أن تكون قواعد البيانات هذه الأيام قادرة على التعامل مع أعباء العمل بسلاسة سواء في مكان العمل أو عبر العديد من السحابات.

وبعد ذلك، هناك أيضًا ما يبدو الآن وكأنه معضلة قديمة: هل يتعلق الأمر بـ SQL أم NoSQL؟ في حين أن تغيير التصميم التقليدي لقواعد البيانات العلائقية قد جلب فوائد من حيث قابلية التوسع، فإن استبدال SQL ليس بالضرورة أمرًا يريده الناس.

إذًا كيف يمكن الجمع بين SQL والسحابة الأصلية والسحابة المتعددة والسحابة المختلطة؟

سحابة متعددة وسحابة هجينة تلبي SQL

ليس من المستغرب أن يكون هناك عدد قليل من عروض قواعد البيانات السحابية الأصلية المتوفرة من بائعي السحابة. بعضها، مثل Azure CosmosDB، وGoogle Spanner، وAWS Aurora، يدعم أيضًا SQL. ومن الواضح أن أيا منها ليس متعدد السحابة.

أيضًا: سيكون عام 2019 "عامًا آخر للرسم البياني": OpenCorporates هو الدليل رقم 1

هناك أيضًا عدد قليل من قواعد البيانات السحابية المتعددة، مثل DataStax Enterprise أو MongoDB، والتي تعمل على الاستفادة من هذه القوة وإضافة ميزات بدون خادم. كونك مفتوح المصدر هو سمة مشتركة بين هذه العروض. بالرغم من ذلك، عادةً لا يكون لديهم دعم SQL.

ولكن هل هناك خيارات سحابية أصلية، وتدعم السحابة المتعددة والسحابة المختلطة، وSQL، والمصدر المفتوح؟ عدد قليل، و صرصورDB ومن أبرزهم.

إذا كنت تتساءل عن معنى الاسم، فهو إشارة إلى المرونة، وهو الشيء الذي تشتهر به الصراصير. تأسست شركة Cockroach Labs، موطن CockroachDB مفتوح المصدر، في عام 2015 على يد موظفي Google السابقين سبنسر كيمبال، وبيتر ماتيس، وبن دارنيل. أثناء وجودهم في Google، استخدموا جميعًا Bigtable وكانوا على دراية بخليفتها Spanner. ثم، لقد شرعوا في بناء شيء يمكنه فعل ما يستطيع Spanner القيام به، وأكثر من ذلك.

المرونة هي السبب وراء تسمية CockroachDB بهذا الاسم. ولكن هناك المزيد في قاعدة البيانات هذه المثيرة للاهتمام إلى جانب الاسم.

زد نت أجرى أسئلة وأجوبة مع Kimball، الرئيس التنفيذي لشركة Cockroach Labs، للمناقشة أين هم في رحلتهم، وما سيأتي بعد ذلك. منذ عام 2015، نمت شركة Cockroach Labs لتضم ما يقرب من 100 موظف، وانتقلت إلى مكتب جديد في مدينة نيويورك، وافتتحت ثلاثة مكاتب جديدة في سياتل وبوسطن وسان فرانسيسكو، وجمعت ما مجموعه 53.5 مليون دولار على ثلاثة مكاتب جولات.

وقال كيمبال إنهم أمضوا معظم السنوات الثلاث الأولى في تصميم المنتج الأساسي وتنفيذه، حيث ركز ما يقرب من 80 بالمائة من الموظفين على البحث والتطوير. وفي الآونة الأخيرة، قاموا ببناء دعم العملاء، والتسويق، وعمليات الأفراد، وفرق المبيعات، وهم الآن أقرب إلى 50 بالمائة من عدد الموظفين المخصصين للبحث والتطوير.

كل هذه تبدو وكأنها علامات على النضوج. ولكن أين يقف CockroachDB مقارنة بالمنافسة؟ يعتقد Kimball أن الأمر يتعلق بشكل أساسي بقدرات نظام SQL RDBMS الموزع جغرافيًا، ولكنه يتم تقديمه بطريقة يوفر المرونة للعملاء الذين لا يستطيعون أو لا يرغبون في المشاركة بكل شيء واحتضان عرض خاص من سحابة واحدة بائع.

التوزيع الجغرافي للفوز

ولكن على الرغم من أن التمييز بين الحلول التي يقدمها بائعو الخدمات السحابية وNoSQL واضح، CockroachDB ليست لعبة SQL السحابية الأصلية والمتعددة/الهجينة الوحيدة في المدينة. ما يميزها، وفقًا لكيمبال، هو التوزيع الجغرافي:

"لقد أمضينا الكثير من الوقت في تنفيذ CockroachDB من الألف إلى الياء لتوفير لغة SQL موزعة جغرافيًا بشكل حقيقي. الداخلون الأحدث إلى سوق SQL السحابي الأصلي إما أنهم غير موزعين جغرافيًا (TiDB، Citus)، أو جانب SQL هو رأس متجانس تم لصقه على نص موزع (Yugabyte، FoundationDB، أورورا).

ينتج عن التوزيع الجغرافي ميزتين أساسيتين: المرونة، والتي يمكنها تحمل مراكز البيانات وحتى حالات الفشل على مستوى المنطقة، وتوطين البيانات، والتي يمكن أن تبقي البيانات قريبة من العميل لوقت الاستجابة و خصوصية. من بين كبار البائعين، فإن Spanner وAurora فقط يقدمان نفس نموذج المرونة، على الرغم من أن Aurora يقتصر على منطقة واحدة. لا يوجد بائعو قواعد بيانات آخرون يقدمون حتى الآن إمكانات توطين البيانات التي يقدمها CockroachDB."

يعد التوزيع الجغرافي ميزة أساسية في CockroachDB

أيضًا: تعد شركة Habana، الشركة المبتكرة لشرائح الذكاء الاصطناعي، بأعلى مستوى من الأداء والكفاءة

أشار Kimball إلى أنهم عندما بدأوا الشركة، لم يكونوا متأكدين بعد من المكان الذي ستتناسب فيه CockroachDB مع النظام البيئي، أو ما هي أنواع الشركات التي ستكون مستعدة وقادرة على الانتقال إلى نظام RDBMS جديد. ومع ذلك، أضاف أنه في عام 2018 بدأوا في الإجابة على هذه الأسئلة وانتهوا بعام أول مثير للإعجاب من الإيرادات:

"لقد اتضح أن الكثير من شركات Fortune 2000 تعاني في كثير من الأحيان من التفويضات على مستوى مجلس الإدارة لتبني فوائد السحابة العامة. وتفتح عملية التحديث هذه الباب أمام النظر في بدائل لشركة أوراكل، وخاصة قواعد البيانات الأكثر ملاءمة لاستغلال الفرص الكامنة في السحابة.

حيث يتمتع CockroachDB بميزة استراتيجية كبيرة على أمثال AWS Aurora أو Google Cloud Spanner، فهو أننا نقدم الجسر من واقع عمليات النشر المحلية الحالية إلى النتيجة المرجوة من استخدام السحابة العامة أينما كانت حاسة. يمكن تشغيل CockroachDB محليًا ومختلطًا وعبر بائعي السحابة العشوائيين."

الأعمال التجارية، وتلبية المصادر المفتوحة. المصدر المفتوح، تلبية السحابة.

يقودنا هذا إلى موضوع مثير للاهتمام: المنافسة مع بائعي السحابة وبند المشاعات. هذا شيء يواجهه العديد من برامج البائعين مفتوحة المصدر، حيث يأخذ بائعو السحابة منتجاتهم ويقدمونها كخدمات مُدارة، ويتنافسون بشكل مباشر مع بائعي البرامج المذكورين. كرد، يقوم بائعو البرامج بتعديل تراخيصهم لمنع ذلك. اعترف كيمبال بأن هذه مشكلة كبيرة:

"عندما اعتقد الجميع أن نموذج عمل مستقر قد تطور للشركات مفتوحة المصدر، قامت AWS بتحسين عملية التعدين القطاعي الخاصة بها. نحن لا نواجه حتى الآن نفس مجموعة الشروط التي تواجهها شركة Confluent، سواء من حيث اعتماد السوق أو المنافسة المباشرة من AWS مع منتجنا الأساسي مفتوح المصدر. بالإضافة إلى ذلك، فإن الإشراف على كافكا من قبل مؤسسة أباتشي يقدم بعض التعقيد في نظام ترخيص Confluent.

ومع ذلك، يتعين علينا أن نعالج نفس المشكلة الجذرية. لقد كنا من أوائل الشركات التي قدمت ترخيصًا مؤسسيًا متاحًا للمصدر وحتى الآن يجب الحرص على تطبيقه فقط على الميزات المفيدة بشكل أساسي للشركات التي يجب أن تدفع لنا حقًا."

يعد المصدر المفتوح عامل تمكين لبرامج المؤسسات، ولكن المنافسة من موردي الخدمات السحابية تؤدي إلى حدوث احتكاك وتؤدي إلى تعديلات الترخيص

بويجوفيديو، غيتي إميجز / آي ستوك فوتو

وأشار Kimball أيضًا إلى أن السلوك التنافسي لـ AWS سيضغط عليهم لإضافة ميزات تقليدية سيكون مصدرًا مفتوحًا خالصًا للفئة "المجانية" لترخيص مؤسستنا، ولإضافة استثناء لما يشبه AWS سلوك.

يبدو أن العمل يسير على ما يرام بالنسبة لشركة Cockroach Labs، على الرغم من المنافسة. ونود أن نضيف أيضا أسماء مثل NuoDB إلى تلك القائمة، على الرغم من أن NuoDB ليس عرضًا مفتوح المصدر. يأتي CockroachDB بثلاث نكهات: الأساسية، المؤسسة، والمدارة. تعد ميزات مثل التقسيم الجغرافي والنسخ الاحتياطي والاستعادة الموزعة والأمان الإضافي جزءًا من إصدار Enterprise.

أيضًا: يُظهر Confluent أن المصادر المفتوحة والتحولات النموذجية والسحابة والنجاح التجاري يمكن أن تتعايش معًا

يتم إدراج أسماء مثل Comcast وBaidu ضمن مستخدمي CockroachDB. وجود سابقة مع أحد مضرب باستخدام المصدر المفتوح أباتشي فلينك، وفي النهاية الحصول على حرفيي البيانات، البائع الذي يقدم الدعم لذلك، كنا مهتمين بالتعرف على علاقة Cockroach Labs مع Baidu. قال Kimball إن Baidu لجأت إلى CockroachDB لاستبدال MySQL المقسمة بقاعدة بيانات موزعة تتوسع أفقيًا مع توفير واجهة SQL المألوفة.

يقترح MySQL وواجهات SQL المألوفة: تجدر الإشارة إلى أن CockroachDB متوافق مع PostgresSQL. اتخذ CockroachDB هذا القرار لعدد من الأسباب، وليس أقلها القدرة على العمل كبديل. تم أيضًا أخذ التوافق مع MySQL بعين الاعتبار، لكن واحدًا فقط يمكنه العمل. ومن المثير للاهتمام أن كلاهما PostgresSQL و ماريا دي بي، فرع MySQL، يقومون الآن ببناء عملياتهم السحابية. القليل من SQL مفتوحة المصدر يقطع شوطا طويلا.

عن كونك مواطنًا سحابيًا، وKubernetes، والبث، والتحليلات، وHTAP، ومستقبل CockroachDB

حتما، تطرقت المناقشة تأثير Kubernetes على قواعد البيانات أيضًا. مختبرات الصرصور عضو في CNCFويعتقد كيمبال أن Kubernetes، أكثر من أي مشروع آخر لـ CNCF، ينير الطريق نحو النتيجة المرجوة:

"يمكن تشغيله محليًا ومحليًا على جميع البائعين السحابيين، مما يمنح العمليات مستوى تحكم متسق عبر البيئات. وهذا هو السبب في أنه أحد أسرع المشاريع مفتوحة المصدر نموًا على الإطلاق.

ومع ذلك، بالمقارنة مع Borg، المشروع داخل Google الذي ألهمه، لا يزال Kubernetes في بداياته. لقد كافحت مؤخرًا للتعامل مع الخدمات ذات الولاية. ستكون الأدوات الإضافية ضرورية لتنسيق مجموعات Kubernetes المتعددة عبر المناطق أو موفري الخدمات السحابية. تعتبر هذه القدرات ضرورية لتمكين ميزات CockroachDB مثل النسخ المتماثل الجغرافي والتقسيم الجغرافي.

تمتلك CockroachDB حصة كبيرة في Kubernetes، كما أنها تنتمي إلى السحابة مع إمكانية القياس الجغرافي التلقائي

بينما لدى CockroachDB حصة كبيرة في Kubernetesماذا عن الميزات مثل دعم البث والتحليلات؟ ذاهب HTAP شيء يمكن أن نتوقع أن نرى؟ قال Kimball إنهم يعالجون حالات استخدام المعاملات أولاً وقبل كل شيء، لكنهم يعتزمون البناء على ذلك:

"إنه سوق بقيمة 45 مليار دولار، لذا فهو هدف رائع. يعد توفير نظام سجل سحابي أصلي وموزع جغرافيًا موضع قوة سنتوسع منه لنصبح عرضًا هائلاً لـ HTAP. وهذا هو الفرق الرئيسي من الإستراتيجية المستخدمة بواسطة Snappy Data أو Splice Machine.

لقد اختارت هذه المنتجات التعامل مع HTAP كفئة منتج متميزة، في حين أننا نؤمن بشدة بأن هذا المنتج الفئة التي تهم في الواقع هي نظام تسجيل OLTP، وإضافة تحليلات أفضل إليه يعد بمثابة انحدار رحلة."

قال Kimball إنهم بصدد توجيه تنفيذ SQL وترقية نظام التخزين الأساسي لتحسين أعباء العمل التحليلية. في هذه الأثناء، التقاط بيانات التغيير الموزعة يسمح بتدفق التغييرات في قاعدة البيانات للمعاملات في الوقت الفعلي إلى التخزين السحابي أو إلى كافكا.

يتيح ذلك إمكانية إقران CockroachDB مع حلول تخزين البيانات أو ذكاء الأعمال. يعد التكامل الأصلي مع Kafka أحادي الاتجاه، ولكن يوجد موصل حوض JDBC لـ Kafka والذي يتوافق معه CockroachDB. واختتم Kimball بذكر ميزات مثل النص الكامل والفهارس الجغرافية المكانية كإضافات مستقبلية محتملة، وأشار إلى أنهم يفكرون بشكل روتيني في إضافة إمكانات الرسم البياني أيضًا.

أيضًا: ابدأ ثورة إعادة صقل المهارات بدوني: اتجاهات مستقبل العمل والبيانات الناعمة عن المهارات الشخصية

 على أية حال، يعد CockroachDB جزءًا من فئة متنامية من قواعد البيانات التي ترغب في الحصول على كل شيء، وتستحق مراقبتها.

ملحوظة: تم تحديث المنشور بتاريخ 28/02/2019، ليشمل إشارة إلى توافق PostgreSQL الخاص بـ CockroachDB، وكيف يرتبط ذلك بالجهود المستمرة التي تبذلها PostgreSQL وMariaDB.

أفضل ما في MWC 2019: تقنية رائعة يمكنك شراؤها أو طلبها مسبقًا هذا العام

قصص ذات الصلة:

  • العصر الجديد لقاعدة البيانات متعددة النماذج 
  • أوراكل تكشف عن خدمة قاعدة بيانات NoSQL المستقلة
  • يريد MongoDB إبعاد قاعدة البيانات عن طريقك 
  • الويب كقاعدة بيانات: أكبر رسم بياني للمعرفة على الإطلاق
  • البيانات الضخمة 2019: السحابة تعيد تعريف قاعدة البيانات 
  • الفصل التالي من Oracle: قاعدة البيانات المستقلة وDBA 
  • ربع بيانات الشركة موجودة الآن في السحابة