Veri bilimi için Python vs R: Profesör programlama dili rakiplerini derecelendiriyor

  • Sep 06, 2023

R uzmanı, tartışmayı programlama dillerinin "adil ve yararlı" bir analiziyle çözmeyi umuyor.

Programlama dilleri Python ve R genellikle veri bilimi ve analizi için en iyisinin hangisi olduğu konusunda birbirleriyle yarışırlar. İkisi de popüler ama Python çok daha yaygın olarak kullanılıyor gibi görünüyoren azından programlamayı öğrenen insanlar tarafından.

Öne Çıkanlar

  • Windows 10 kendi iyiliği için fazla mı popüler?
  • Kariyerinize başlamak için en iyi yeri bulmanın 5 yolu
  • Üretken yapay zeka, esnek ekonomiyi bu şekilde daha iyiye doğru değiştirecek
  • Bu 300 dolarlık Android'i Google'ın Pixel 6a'sına tercih etmemin 3 nedeni

Ancak veri bilimi spesifik bir alan olduğundan Python dünyanın en popüler dili olarak ortaya çıkıyorR hala yerini koruyor ve veri analizi yapanlar için avantajlara sahip.

Yıllardır devam eden R ve Python tartışmasını çözüme kavuşturmak umuduyla Kaliforniya Üniversitesi, Davis, bilgisayar bilimi profesörü Norm Matloff bir makale yayınladı. göreceli güçlü yönlerinin kısa özeti

 zarafet, kullanıldıkları alanlar, kütüphane ekosistemleri ve öğrenme zorluğu gibi temel ölçütler genelinde.

Matloff, R hakkında dört kitap yazmıştır ve R Journal'ın baş editörüböylece onu Python'a tercih ettiği görülebilir. Ancak analizinin "adil ve yararlı" olarak görülmesini umduğunu söylüyor.

Konu zarafet olduğunda bunun "Python için açık bir kazanç" olduğunu söylüyor, kısmen Python'un parantez ve kaşlı ayraçları sınırlı kullanması nedeniyle. "Python şık" diye ekliyor.

Ancak bu, iki dilden birini öğrenen yeni başlayanlar için "R için büyük bir kazanç". Python'a karşı argümanı, onu veri bilimi için kullanan bir kişinin, Matlab benzeri veri analizi güçlerini Python'a getiren NumPy gibi ekstra Python paketleri hakkında bilgi edinmesi gerektiğidir. İstatistiksel hesaplama için tasarlanan R, halihazırda yerleşik veri analizi özelliklerine sahiptir.

"Buna karşılık, matris türleri ve temel grafikler R tabanına yerleşiktir. Acemi bir kişi birkaç dakika içinde basit veri analizleri yapabilir" diye iddia ediyor Matloff.

"Python kitaplıklarının yapılandırılması sistem meraklıları için bile zor olabilir, oysa çoğu R paketi kutudan çıktığı gibi çalışır."

Python Paket Dizini (PyPI) şu anda 183.000'den fazla proje var, mevcut R paketlerinin sayısından çok daha fazla Kapsamlı R Arşiv Ağı (CRAN). CRAN'a göre, 14.385 paket mevcut mu. Bu farklılığa rağmen Matloff bunun beraberlik olduğunu düşünüyor.

GÖRMEK: Python dünyayı yiyor: Bir geliştiricinin yan projesi nasıl gezegendeki en popüler programlama dili haline geldi (kapak hikayesi PDF) (TechRepublic)

PyPI'nin "veri bilimi açısından zayıf göründüğünü" belirtiyor. PyPI üzerinde yapılan aramalar log-doğrusal model, Poisson regresyonu, enstrümantal değişkenler, mekansal veriler ve aile bazında hata oranı için "hiçbir şey ortaya çıkarmadı".

Bununla birlikte, Python'un makine öğreniminde R'ye göre "hafif bir üstünlüğü" var ve Matloff da bunu istiyor gibi görünüyor R için makine öğrenimi kitaplıklarının geliştirilmesi için çok az çabayla yapılabileceğini söylüyor zorluk.

"Python kitaplıklarının gücü, R'lerde kolayca uygulanabilecek belirli görüntü yumuşatma operasyonlarının ayarlanmasından gelir. Keras sarmalayıcı ve bu nedenle TensorFlow'un saf R versiyonu geliştirilebilir," diye savunuyor Matloff.

GÖRMEK: Başarılı bir geliştirici kariyeri nasıl oluşturulur? (ücretsiz PDF)

Tipik olarak Python yanlısı makine öğrenimi (ML) "ML'deki istatistiksel sorunları çoğu zaman zayıf bir şekilde anlayan ve hatta bazı durumlarda küçümseyen" kişileri bıçaklamaya devam ediyor. Bu nedenle hangi dilin en fazla istatistiksel doğruluğa sahip olduğu sorusu "R için büyük bir kazançtır".

"R için korkunç bir kayıp" dil birliğidir. R'nin "birbiri tarafından anlaşılmayan iki lehçeye, sıradan R ve Tidyverse'ye dönüştüğünü" söylüyor. Ve bu durumdan doğrudan RStudio şirketini sorumlu tutuyor.

Tidyverse çok popüler R paketlerinden oluşan bir koleksiyondur. Temel olarak Matloff, RStudio gibi ticari bir ekibin R projesi üzerinde sahip olduğu "aşırı etkiye" sahip olmaması gerektiğine inanıyor.

"Tidyverse'nin sıradan R'den daha üstün olması daha kabul edilebilir olabilir, ancak bana göre değil. Yeni başlayanlar için işleri daha da zorlaştırır. Örneğin, Tidyverse'nin bazıları karmaşık olan o kadar çok işlevi var ki, R tabanında çok basit işlemleri yapmak için öğrenilmesi gerekiyor," diye savunuyor Matlof.

Python ve programlama dilleri hakkında daha fazla bilgi

  • Programlama dilleri: Python'un önümüzdeki 4 yıl içinde C ve Java'yı geçeceği tahmin ediliyor
  • Python geliştiricisi, veri bilimcisi veya DevOps: Hangi teknoloji işleri en iyi getiriyi sağlar?
  • Programlama dili Python'un Visual Studio Code için popüler uzantısı yenilendi
  • Programlama dilinin popülerliği: C++ Python'un pahasına geri dönüyor
  • Programlama dilleri: JavaScript geliştiricileri neden TypeScript'i seçiyor?
  • R vs Python: İstatistik işlerindeki patlamaya rağmen R, en iyi 20 programlama dili arasında
  • Netflix: Yayınladığınız her filmin arkasında Python programlama dili var
  • TypeScript, JavaScript'in yerini alabilir mi? Programlama dili spin-off'unun kullanımı hızla artıyor
  • Programlama dilleri: Geliştiriciler artık Stack Overflow'ta Python hakkında JavaScript'ten daha fazla soru soruyor
  • Programlama dilleri: Python yükselişte ancak Groovy, geliştiriciler arasında yine harika
  • Python programlama dilinin en iyi kullanım alanları, araçları: Geliştiriciler seçimlerini açıklıyor
  • En çok para kazandıran programlama dilleri, beceriler: İşte en çok kazananlar
  • Programlama dilleri: 2019'da bunları öğrenme zahmetine girmeyin
  • Programlama dilleri: Python geliştiricilerinin sayısı artık Java geliştiricilerini geride bırakıyor
  • Programlama dilleri: Geliştiriciler en çok sevileni, en çok nefret edileni ve en çok neyin kazandırdığını ortaya koyuyor
  • Java'ya karşı Python: Geliştiriciler için hangi programlama dili daha popüler? TechRepublic
  • Programlama dilleri: Python'un kurucuyu uç noktalara yaklaşmaya iten PEP 572 özelliği TechRepublic
  • 2019'da en çok kazandıran programlama dilleri ve becerileri TechRepublic
  • Julia bir sonraki büyük programlama dili mi? MIT, sürüm 1.0'ın çıkmasıyla birlikte öyle düşünüyor TechRepublic
  • Mozilla'nın radikal açık kaynak hamlesi teknolojinin kurallarının yeniden yazılmasına yardımcı oldu CNET