Cray'in Urika-GX'i büyük veri analitiğini hedefliyor

  • Oct 30, 2023
cray-urika-gx-sytem.png

Cray Urika GX: GD ve XA'nın en iyilerini daha küçük bir formatta birleştirmeyi hedefliyor.

Fotoğraf: “Cray”

İş analitiği günümüzde çoğu iş sisteminin temel bir özelliğidir ve şirketler bunlardan en iyi şekilde yararlanmak için onlara giderek daha fazla bilgi işlem gücü tahsis etmektedir.

Cray'in en üst düzey platformunun en son ürünü olan yeni Urika-GX, özellikle analitik pazarını hedefleyen açık, kurumsal bir çerçeve sağlıyor.

Şirket, yeni makinelerin halihazırda yaşam bilimleri, sağlık hizmetleri ve siber güvenlik sektörlerindeki müşteriler tarafından kullanıldığını söyledi. Örneğin, MIT Broad Institute ve bir araştırma enstitüsü olan Harvard, yüksek verimli genom dizileme verilerini analiz etmek için Cray Urika-GX sistemini kullanıyor.

Cray'in EMEA ticari operasyonlarından sorumlu başkan yardımcısı Dominik Ulmer'e göre bu, Cray için pek de yeni bir zemin değil. Şirket son dört yıldır analitik işinde bulunuyor.

Ulmer'e göre bu, grafik analizine dayalı bir sistemle başladı. İlk sistem Urika GD, ikincisi Urika XA idi ve şimdi GX'i piyasaya sürdü.

Ulmer, "Bu, iki ürünün birleşmesi gibi görünebilir ve bunun bir unsuru da var" dedi.

GX'in arkasındaki düşünce, günümüzde şirketlerin veri odaklı kararlar almasıdır. Dolayısıyla, gerçekten veriye dayalı karar almaya dayalı bir rekabet avantajına sahip olmak istiyorsanız, "bunları mümkün olduğunca hızlı, yüksek sıklıkta ve esnek bir şekilde yapmalısınız" dedi.

Bunun, farklı hipotezleri olabildiğince hızlı ve eş zamanlı olarak test edebilmek anlamına geldiğini ve Cray'in "çevik analitik" olarak adlandırdığı şeyin bu olduğunu söyledi.

"Süper bilgi işlem yığınımızın özelliklerini seçtik" dedi.

Ulmer, Cray GX'in yüksek kaliteli analizler yapmak ve veri keşfi gerçekleştirmek isteyen veri bilimcilerini hedeflediğini söyledi. "Bu, Hadoop ve Spark gibi standart araçlarla üst düzey veri analistleri yapmak anlamına geliyor. Urika GD sistemimizde sahip olduğumuz bir şey; grafik analitiğine sahip özel, amaca yönelik tasarlanmış donanım tepe."

Bunun, araştırmacıların bilinmeyen kalıpları, yeni bağımlılıkları ve ilişkileri keşfetmeleri için daha derinlere inmelerine yardımcı olacağına inanıyor.

Amacının, kullanıcıların gerçek zamanlı olarak yan yana çalışan bir dizi modelle uyarlanabilecek gerçek zamanlı analitikler yapmalarına olanak tanımak ve böylece hipotezleri test ederken daha hızlı bir geri dönüşe yol açmak olduğunu söyledi.

Cray'den Ulmer: "Amaç süper bilgisayar gücünü açık, kurumsal bir formatla birleştirmektir."

Fotoğraf: “Cray”

GX'in performansı nasıl artıyor? Cray, GX'in karşılaştırmalı değerlendirmelerini "büyük bir bulut sağlayıcısından" gelen bir sistemle karşılaştırarak ve Ulmer'e göre yükleme ve yükleme gibi basit iş yüklerinde çalıştırdı. bölümlemede GX iki kat daha hızlıydı ve PageRank (web sitelerini sıralamak için Google arama tarafından kullanılan bir algoritma) gibi daha karmaşık görevlerde GX dört kat daha hızlı.

Sistem, Hadoop ve Spark'ın yanı sıra önceden entegre edilmiş standart bir Apache çerçevesi kullanır. "Bu, birkaç gün içinde dağıtabileceğiniz bir şey ve yazılımı açmak için hızlı bir şekilde üretim modundasınız" dedi.

"GX önceden entegre edilmiştir ancak kapalı bir kutu değildir" dedi. Önceden entegre edilmiş olması ve aynı zamanda "BT departmanının talep ettiği tüm standart özelliklere ve kontrollere sahip olabilmesi" nedeniyle bunun her iki açıdan da en iyisi olduğuna inanıyor.

Yazılım tarafında Linux çalıştıran bir temel yazılım yığını var. Ulmer'e göre bunun üzerine CentOS çekirdeği ve bunun da ötesinde onu "çok hafif bir işletim sistemi" haline getirecek değişiklikler var.

Bunun da ötesinde, Cray'in kendi derleyicisinin yanı sıra Java, Python veya kullanıcının istediği herhangi bir şeyi temel alan standart bir analiz ortamı da bulunur.

Bunun da ötesinde HDFS veya standart bir Cray seçeneği olabilir. Bunun da ötesinde, donanım kaynaklarını soyutlayan ve bunları kullanıcıların kullanımına sunan bir Apache Mesos düzeyi vardır. uygulamalar ve bunun da ötesinde iki farklı iş yükü yöneticisi vardır: Analitik tarafı için Yarn veya Cray'in tarafı Slurm.

Son olarak, çok uzun bir yığının üzerinde Hadoop, Spark veya Cray grafik motoru bulunabilir.

Yeni sistem üç boyutta mevcut olacak: 16 düğüme sahip küçük, 32 düğüme sahip orta ve 48 düğüme sahip büyük. En büyük sistem, birden fazla konfigürasyonda 18 çekirdekli Intel Broadwell işlemcileri kullanacak.

Ulmer, "L konfigürasyonunda 1.728 çekirdeğe sahip olacaksınız" dedi. Bununla 22 TB'a kadar DRAM ve 35 TB'a kadar DDS'ye ve tümü 192 TB'a kadar diske sahip olursunuz.

Cray hakkında daha fazlasını okuyun

  • Cray'in bakış açısı işletmelerin süper bilgisayarlara yönelebileceğini gösteriyor
  • Avustralya Meteoroloji Bürosu Cray'den 77 milyon AU$'lık süper bilgisayar satın aldı
  • Nutanix, orta ölçekli pazara yönelik Citrix sanal masaüstü sistemini piyasaya sürüyor