एक सेवा के रूप में डेटा वैज्ञानिकों की खोज करना

  • Sep 26, 2023

यह अतिथि पोस्ट टोनी बेयर के सौजन्य से आई है ऑनस्ट्रैटेजीज़ ब्लॉग. टोनी है वरिष्ठ विश्लेषक पर डिंब.

टोनी बेयर द्वारा

मैंयह कोई रहस्य नहीं है कि रॉकेट.. ग़लती... डेटा वैज्ञानिकों की कमी है। डेटा का विस्फोट और औजारों का तदनुरूपी विस्फोट, और टकराने का प्रभाव मूर का और मेटकाफ का कानून, यह है कि इसे संसाधित करने के लिए पहले से कहीं अधिक डेटा, अधिक कनेक्शन और अधिक तकनीक है। पिछले वर्ष में हडोप वर्ल्ड, वहाँ था एक पागलो की तरह भोजन करने वाला के लिए डेटा वैज्ञानिक, जिसने अधिक तकनीकी रूप से उन्मुख लोगों की मांग को बमुश्किल बौना कर दिया डेटा आर्किटेक्ट. अंग्रेजी में इसका मतलब है:

1. संभावना मैकआर्थर ग्रांट प्राप्तकर्ता जिनके पास डेटा के लिए जुनून और अंतर्दृष्टि है, उन्हें आगे बढ़ाने के लिए गणितीय और सांख्यिकीय कौशल है एल्गोरिदम, और उस चित्र को चित्रित करने की कलात्मकता जिससे वह सारा डेटा प्राप्त होता है। डेटा वैज्ञानिकों से हमारा यही तात्पर्य है।

2. जो लोग मंच पक्ष को समझते हैं बड़ा डेटा, उर्फ, डेटा वास्तुकार या डेटा इंजीनियर.

डेटा आर्किटेक्ट पक्ष को क्रैक करना अधिक सरल होगा। बड़े डेटा प्लेटफ़ॉर्म को समझना (

Hadoop, MongoDB, रियाक) और उभरता हुआ उन्नत एसक्यूएल प्रसाद (एक्सडाटा, नेटेज़ा, ग्रीनप्लम, वर्टिका, और हाल के नवोदितों का एक समूह जैसे Calpont) एक तकनीकी कौशल है जिसे अच्छी तरह से परिभाषित पाठ्यक्रमों के साथ सिखाया जा सकता है। आपूर्ति और मांग के नियम इसे हल कर देंगे - ठीक वैसे ही जैसे उन्होंने तब किया था जब डॉट कॉम बुलबुला बना था 1999 में जावा प्रोग्रामर की मांग शुरू हुई.

Hadoop प्रोग्रामर्स के सारे शोर के पीछे, डेटा वैज्ञानिकों की भर्ती के लिए एक समान, लेकिन शांत बेताब भीड़ है। जबकि कुछ डेटा वैज्ञानिक डेटा वैज्ञानिक को कहते हैं मूलमंत्र, आवश्यकता वास्तविक है।

यह सब बिंदुओं को जोड़ने के बारे में है, यह उतना आसान नहीं है जितना लगता है।

तथापि, डेटा विज्ञान क्रैक करने के लिए एक कठिन संख्या होगी। यह सब बिंदुओं को जोड़ने के बारे में है, यह उतना आसान नहीं है जितना लगता है। बड़े डेटा के V - आयतन, विविधता, वेग और मूल्य - के लिए किसी ऐसे व्यक्ति की आवश्यकता होती है जो डेटा से अंतर्दृष्टि खोजता हो; परंपरागत रूप से, वह भूमिका किसके द्वारा निभाई जाती थी डेटा निकालने वाला. लेकिन डेटा खनिकों ने बेहतर सीमा वाली समस्याओं और अच्छी तरह से सीमित (और ज्ञात) डेटा सेट से निपटा, जिससे समस्या अधिक 2-आयामी हो गई।

बड़े डेटा की विविधता - रूप में और स्रोतों में - अज्ञात के एक तत्व का परिचय देती है। बिग डेटा को समझने के लिए खोजी समझ, संचार कौशल, रचनात्मकता/कलात्मकता और प्रति-सहज तरीके से सोचने की क्षमता के मिश्रण की आवश्यकता होती है। और यह मत भूलिए कि यह सब एक ठोस सांख्यिकीय और मशीन सीखने की पृष्ठभूमि के साथ-साथ व्यापार के टूल और प्रोग्रामिंग भाषाओं के तकनीकी ज्ञान की नींव पर आता है।

कभी-कभी ऐसा लगता है जैसे हम अल्बर्ट आइंस्टीन या किसी बुद्धिमान व्यक्ति की तलाश कर रहे हैं।

प्रकृति शून्यता से घृणा करती है

प्रकृति शून्यता से घृणा करती है, डेटा वैज्ञानिक क्या है, इसे न केवल परिभाषित करने की होड़ मची है, बल्कि ऐसे प्रोग्राम विकसित करने की भी होड़ मची है जो किसी तरह इसे सिखाओ, सॉफ़्टवेयर पैकेज इसे कुछ हद तक पैकेज करते हैं, और अन्यथा उन्हें एक मांस में फेंक देते हैं... ग़लती, मुफ़्त बाज़ार। ईएमसी और अन्य विक्रेता न केवल प्लेटफ़ॉर्म पर, बल्कि डेटा विज्ञान के लिए भी प्रशिक्षण देने के लिए आगे आ रहे हैं। कागल डेटा विज्ञान के लिए एक अभिनव क्लाउड-आधारित, क्राउडसोर्स्ड दृष्टिकोण प्रदान करता है, एक पूर्वानुमानित मॉडलिंग प्लेटफ़ॉर्म उपलब्ध कराता है विशेष समस्याओं के सर्वोत्तम समाधान तैयार करने के लिए डेटा वैज्ञानिकों के लिए प्रायोजित 24-घंटे की प्रतियोगिताओं का आयोजन (पुनः) नेटफ्लिक्स $1 मिलियन का पुरस्कार एक बेहतर उपाय तैयार करने के लिए कलन विधि दर्शकों की प्राथमिकताओं की भविष्यवाणी करने के लिए)।

डेटा विज्ञान प्रतिभा दुर्लभ होने के कारण, हम उम्मीद करते हैं कि परामर्श कंपनियाँ ऐसी प्रतिभाएँ खरीदेंगी जिन्हें बाद में कई ग्राहकों को "किराए पर" दिया जा सकता है। कुछ अपतटीय फर्मों को छोड़कर, कुछ सिस्टम इंटीग्रेटर्स (एसआई) औपचारिक बड़े डेटा प्रथाओं (वह तार्किक स्थान जहां डेटा वैज्ञानिक निवास करेंगे) को शुरू करने के लिए अभी तक कदम नहीं उठाया है, लेकिन हम उम्मीद करते हैं कि यह जल्द ही बदल जाएगा।

ओपेरा समाधान2004 से प्रेडिक्टिव एनालिटिक्स कंसल्टेंसी के खेल में सक्रिय, पैकेजिंग मार्ग पर अगला कदम उठा रहा है। होना सीरीज ए फंडिंग में $84 मिलियन जुटाए पिछले वर्ष, कंपनी ने लगभग 200 डेटा वैज्ञानिकों को नियुक्त किया है, जिससे यह Google के इस क्षेत्र में प्रतिभाओं के सबसे बड़े समूह में से एक बन गया है। ओपेरा के पूर्वानुमानित विश्लेषण समाधान विभिन्न प्लेटफार्मों, SQL और Hadoop के लिए डिज़ाइन किए गए हैं, और आज वे इसमें शामिल हो गए हैं एसएपी नीलमणि पर उनकी पेशकश की रिलीज के साथ घोषणा स्ट्रीम हाना इन-मेमोरी डेटाबेस। एंड्रयू ब्रस्ट एक अच्छा प्रदान करता है ड्रिल द्वारा छेद बनाएं इस घोषणा के विवरण पर।

बाजार की मांग के साथ, डेटा वैज्ञानिकों की परिभाषा अनिवार्य रूप से कम हो जाएगी ताकि अधिक कंपनियां दावा कर सकें कि उनके पास एक या कई हैं।

एसएपी के दृष्टिकोण से, ओपेरा के पूर्वानुमानित विश्लेषण समाधान हाना के लिए तार्किक रूप से फिट हैं क्योंकि उनमें निम्न प्रकार शामिल हैं जटिल समस्याओं (उदाहरण के लिए, एक गणना अन्य गणनाओं को ट्रिगर करती है) के लिए उनका नया इन-मेमोरी डेटाबेस प्लेटफ़ॉर्म डिज़ाइन किया गया था के लिए।

यह उम्मीद करने के लिए बहुत अधिक मूल्य दांव पर है कि ओपेरा भाड़े के लिए डेटा वैज्ञानिकों का एकमात्र बड़ा समूह बना रहेगा। लेकिन विडंबना यह है कि प्रवेश की बाधाएं प्रतिस्पर्धा को संकीर्ण और अत्यधिक केंद्रित बनाए रखेंगी। बेशक, बाजार की मांग के साथ, डेटा वैज्ञानिकों की परिभाषा अनिवार्य रूप से कम हो जाएगी ताकि अधिक कंपनियां दावा कर सकें कि उनके पास एक या कई हैं।

डेटा वैज्ञानिकों के लिए आपूर्ति और मांग के नियम लागू होंगे, लेकिन अधिक प्लेटफ़ॉर्म-उन्मुख डेटा आर्किटेक्ट या इंजीनियर के लिए आपूर्ति में वृद्धि उतनी तेज़ नहीं होगी। आवश्यकतानुसार, डेटा वैज्ञानिकों की आपूर्ति को ऐसे सॉफ़्टवेयर द्वारा संवर्धित करना होगा जो व्याख्या को स्वचालित करता है मशीन लर्निंग, लेकिन अभी तक ही आप रचनात्मकता और प्रति-सहज ज्ञान युक्त अंतर्दृष्टि को प्रोग्राम कर सकते हैं मशीन।

यह अतिथि पोस्ट टोनी बेयर के सौजन्य से आई है ऑनस्ट्रैटेजीज़ ब्लॉग. टोनी है वरिष्ठ विश्लेषक पर डिंब.

इसमें आपकी भी रुचि हो सकती है:

  • तेज़ डेटा बड़े डेटा की तेज़ लेन को प्रभावित करता है
  • EMC की Hadoop रणनीति पीछा करने में कटौती करती है
  • बड़े डेटा समेकन की दौड़ घरेलू स्तर पर प्रवेश कर रही है, क्योंकि टेराडेटा ने एस्टर डेटा को खरीद लिया है
  • Oracle ने अपनी बड़ी डेटा पेशकश में एक और कमी पूरी की है
  • VMforce: क्लाउड VMware और Salesforce.com के लिए आवश्यक जावा विवाह के साथ मेल खाता है
  • HP ने Fortify को खरीद लिया, और अब समय आ गया है