რატომ შეიძლება იყოს დიდი ტვინი დიდი მონაცემების მთავარი მოთხოვნა?

  • Oct 20, 2023

მოტყუებით მარტივი კონცეფცია, დიდი მონაცემები - იდეა, რომ ყველაფერი რაც თქვენ გჭირდებათ მსოფლიოს ყველაზე დიდი პრობლემების გადასაჭრელად არის ზეტაბაიტი მონაცემები - აქვს გარკვეული პრობლემები პოტენციური გადაწყვეტილებების წინაშე.

ეს არის უსაქმური ფიქრი უსაქმური მომენტისთვის: მსოფლიოში მთელი გამოთვლითი ძალა რომ გქონდეთ თქვენს განკარგულებაში, რა ამოცანის შესრულებას ისურვებდით? დააყენებდით მას კიბოს განკურნებაზე? ან შესაძლოა ძალა გამოვიყენოთ იმის გასარკვევად, არის თუ არა პი-ს აბსოლუტური კვადრატული ფესვი.

დიდი მონაცემები: მიმოხილვა

დიდი მონაცემები: მიმოხილვა

წაიკითხე ახლა

არსებობს უამრავი პრობლემა, რომელთა მოგვარებაც კომპიუტერებს შეუძლიათ - და რაც აშკარა ხდება არის გამოთვლითი რესურსების პრაქტიკულად უსაზღვრო ბუნება მსოფლიოს განკარგულებაში. სადაც 30 წლის წინ 8-ბიტიანი კომპიუტერი და 256KB ოპერატიული მეხსიერება დიდი საქმე იყო, ახლა ჩვენ გვაქვს ოთხბირთვიანი ტელეფონები, რომლებიც ინახავს გიგაბაიტიან ინფორმაციას.

ინფორმაციის უზარმაზარმა საცავებმა მთელს მსოფლიოში, რომლებიც დღითიდღე უფრო დიდი ხდება, წარმოშვა ტერმინი "დიდი მონაცემები" - და მიუხედავად იმისა, რომ ცოტას მოსწონს ეს ტერმინი, ჯერ არავის მოუფიქრია უკეთესი.

დიდი მონაცემების შესახებ საუბრისას, Google და Amazon საუბარში დიდი დრო არ არის. ეს კომპანიები წარმოადგენენ მსოფლიოში მონაცემთა ორ უმსხვილეს მაღაზიას - მონაცემთა მაღაზიებს, რომლებიც იზომება ეგზაბაიტებში და პეტაბაიტებში. მაგრამ Google და Amazon ტიპიურია დღევანდელი მსხვილი საწარმოებისთვის სხვა მხრივ: ჩვენ მათ ვფიქრობთ, როგორც ორ ძალიან დიდ კომპანიას, მაგრამ სინამდვილეში ისინი აერთიანებენ რამდენიმე მცირე ერთეულს.

აიღეთ Amazon, როგორც მაგალითი. Amazon-ში არის მეორადი წიგნების კომპანია (AbeBooks), ჩამოტვირთვის კომპანია (Audible), გამომცემელი (Kindle Publishing), IMDb ფილმების მონაცემთა ბაზის კომპანია, ოთხი ფეხსაცმლის კომპანია და მრავალი, მრავალი სხვა. ამაზონმაც ცოტა ხნის წინ იყიდა ვაშინგტონ პოსტი.

გუგლს შეხედე და სურათიც მსგავსია. კიდევ ერთხელ, "საძიებო გიგანტი" რეალურად მოიცავს მრავალ განსხვავებულ ერთეულს, რომლებიც ბევრ განსხვავებულ რამეს აკეთებენ.

Amazon და Google ზომავენ თავიანთ ფაილებს ინდივიდებსა და კომპანიებზე მრავალ მილიონზე, მაგრამ როგორ აკვირდებიან ყველაფერს? დიდი მონაცემთა ბაზები გვეხმარება. მე Amazon-ის მომხმარებელი ვარ და 2002 წლიდან ვიყიდე Star Trek DVD ყუთების ორი კომპლექტი £122-ად. მე ეს ვიცი, რადგან ამ ტრანზაქციის ყველა დეტალი ჯერ კიდევ Amazon-ის მონაცემთა ბაზაშია. ასეა ყველა სხვა ტრანზაქციის დეტალები მთელ მსოფლიოში ამაზონის მილიონობით მომხმარებლის მიერ. ეს არის დიდი მონაცემები მოქმედებაში. ახლა კომპანიებსა და ინდივიდებს შეუძლიათ ყველაფრის დეტალების შენახვა, რადგან სამყაროს აქვს საკმარისი ადგილი ყველაფრისთვის.

დიდი კითხვაა: ახლა ჩვენ გვაქვს ყველა ეს პეტაბაიტი მონაცემი, რა ვუყოთ მას?

CSC გამოკითხვა

IT აუთსორსინგის კომპანია CSC-მ დაასრულა ანგარიში დიდი მონაცემები და ანალიტიკა დიდ ბრიტანეთში და გაესაუბრა 130 CFO-ს და CIO-ს, რათა ენახათ, როგორ უყურებდნენ ისინი ამ საკითხს ბიზნესის შესაბამისი მხარეებიდან. ყველა შეთანხმდა, რომ IT ინდუსტრია გადამწყვეტ ეტაპზეა დიდი მონაცემების მიერ შემოთავაზებული შესაძლებლობების გამო. პრობლემა ის არის, რომ ჯერ არავინ იცის რა უნდა გააკეთოს მასთან.

თუმცა, გამოკითხვამ გამოავლინა რამდენიმე მნიშვნელოვანი მოსაზრება:

მონაცემები ნებისმიერი ორგანიზაციის კონკურენტუნარიანი ინსტრუმენტია. მაგრამ ეს უნდა იყოს სწორი მონაცემები, სწორად მართული, სათანადოდ მოწყობილი და მომდინარეობდეს წყაროების ნაზავიდან, მათ შორის გარე წყაროებიდან. თუ მონაცემები სუფთა, ზუსტი და შესაბამისია, მაშინ მონაცემების სწორი გამოყენება ორგანიზაციას ძლიერ, ძლიერ პოზიციაში დააყენებს. ასეთი კომპანია ნამდვილად იქნება განვითარებადი ექსპერტი და არა მონდომებული ენთუზიასტი (იხ. ქვემოთ).

მაგრამ სწორი მონაცემების ქონა მხოლოდ პირველი ნაბიჯია. ორგანიზაციებს უნდა შეეძლოთ მონაცემების დაკითხვა, რათა გადააქციონ ისინი ინტელექტად - ანუ ქმედითუნარიან ბიზნესში. CIO-ს არა მხოლოდ უნდა შეეძლოს ამ ქმედებების განხორციელება, არამედ უნდა შეძლოს მათთვის ბიზნეს საქმის შექმნა პირველ რიგში. CSC-ის ანგარიში გარკვეულწილად უნდა დაეხმაროს CIO-ს ასეთი საქმის შექმნაში, რათა მათ შეძლონ მონაცემების მანიპულირება რაც შეიძლება მალე. ყოველივე ამის შემდეგ, თქვენ არ გინდათ, რომ კონკურენტებმა თქვენამდე მიაღწიონ დიდ მონაცემებს.

მონდომებული ენთუზიასტები მიდრეკილია გამოიყენოს მონაცემები უკან დასახევად, წარსული წარმატებისა თუ წარუმატებლობის გასაზომად. ადრეული მიმღებები დრო დაუთმეთ ბევრი მონაცემის შეგროვებას და შესანახად, მაგრამ არ ვარ დარწმუნებული, როგორ გამოვიყენოთ იგი სათანადოდ, მაშინ როცა პოზიტიური პიონერები და განვითარებადი ექსპერტები გამოიყენე მონაცემები პროექტირება, პროგნოზირება, სტრატეგია და მომავლის შესახებ ფიქრი.

გამოკვლეული ორგანიზაციების დაახლოებით ნახევარი აღიარებენ, რომ დიდ მონაცემებს შეიძლება ჰქონდეს ისეთივე დიდი გავლენა მათ კომპანიაზე, როგორც ვებ-გვერდის შექმნა. ეს არის კვლევის ყველაზე დიდი დასკვნა: არა ის, რომ დიდი მონაცემები მოხდება, არამედ იმის აღიარება, რომ დიდი გავლენა (როდესაც სწორად გამოიყენება) ექნება ორგანიზაციებზე.

ფინანსური დირექტორის უმრავლესობა ამბობენ, რომ მონაცემების ხარისხი, რომელზეც მათ აქვთ წვდომა და მისი მიწოდების სიჩქარე, საუკეთესო შემთხვევაში ადეკვატურია. მეორეს მხრივ, ფინანსური დირექტორის 10 პროცენტი ამბობს, რომ მათ მიერ მიღებული მონაცემები ბრწყინვალეა და ეს მათ საშუალებას აძლევს მიაღწიონ ბიზნესის ოპტიმალურ შესრულებას. მიუხედავად იმისა, რომ CIO-ების მეოთხედი ვარაუდობს, რომ მათმა ფინანსურმა ფინანსურმა დირექტორმა არ იცის რა არის დიდი მონაცემები, CFO-ების მხოლოდ 3 პროცენტი გვთავაზობს ამ პერსპექტივას. ანალოგიურად, CFO-ების ნახევარზე მეტი ამბობს, რომ დიდი მონაცემები არის ბალანსზე, მაშინ როცა CIO-ების მხოლოდ 9 პროცენტი ფიქრობს, რომ ასე იქნებოდა.

CFO-ების უმეტესობა IT-ს ხედავს, როგორც ხარჯს - აუცილებელი ღირებულება, მაგრამ ღირებულება მაინც. მრავალი ფინანსური დირექტორის აზრით, IT მიწოდებულია როგორც სერვისი ან კომუნალური პროგრამა, რაც CIO-ს პოზიციონირებს, როგორც პიროვნებას, რომელიც უზრუნველყოფს ასეთი სერვისის ყოველთვის ხელმისაწვდომობას. თუმცა, CFO-ების მნიშვნელოვანი უმცირესობა თვლის IT-ს, როგორც ბიზნესის ზრდის ერთ-ერთ ძირითად ელემენტს და ისინი ასევე ამბობენ, რომ ტექნოლოგიების ხელმძღვანელი იძლევა ამ ზრდის საშუალებას.

უპირატესობა, რომლის მიწოდებაც შესაძლებელია დიდი მონაცემების წარმატებული ექსპლუატაციით მიიღწევა მხოლოდ იმ შემთხვევაში, თუ ორგანიზაციას აქვს IT და ბიზნესი, რომლებიც ერთად მუშაობენ სინერგიაში. მხოლოდ პოზიტიურ პიონერებსა და განვითარებად ექსპერტებს ექნებათ ეს ორი მხარე ერთად ითანამშრომლონ ასეთი შედეგის მისაღწევად.

მონაცემთა მეცნიერები, მათემატიკოსები ან შაბლონების ტრეკერები დასაქმებულები არიან გამოკვლეული ორგანიზაციების ნახევარზე მეტი ინფორმაციის მანიპულირებისთვის. მათი უმეტესობა მუშაობს IT დეპარტამენტში, მაგრამ ნახევარზე ნაკლები მუშაობს ბიზნესში. 2013 წელს ეს ადამიანები უფრო გავრცელებულები უნდა გახდნენ, თუ ორგანიზაციებს სურთ მიიღონ შემოთავაზებული დიდი მონაცემების ჯილდოები.

დიდი მონაცემების გავლენა ორგანიზაციაზე შეიძლება იყოს ახალი დრაივერის დანერგვა IT და ბიზნეს თანამშრომლობისთვის - Chief Information Marketing Officer (CIMO). ეს არის ადამიანი, რომელსაც შეუძლია წარმატებით მოაგროვოს დიდი რაოდენობით მონაცემები სხვადასხვა წყაროდან და უზრუნველყოს ეს მათი ორგანიზაცია იღებს შესაბამის, გააზრებულ, სტრატეგიულ გადაწყვეტილებებს და ხდება მათი ბაზრების განვითარებადი ექსპერტები 2013.

ბოლო წერტილი ალბათ ყველაზე მეტყველია. დიდი მონაცემები არც თუ ისე რთულია ხალხის გასაგებად. პრინციპი ისაა, რომ ყველა ორგანიზაციას აქვს ბევრი მონაცემი, რომელთა დიდი ნაწილი პოტენციურად - შესაძლოა უზომოდ სასარგებლოა. მაგრამ როგორ განვსაზღვროთ რა არის სასარგებლო და რა არა, რა ინსტრუმენტები გჭირდებათ მონაცემების გასაანალიზებლად, როგორ აანალიზებთ მონაცემებს და ასე შემდეგ?

სწორი ტიპის ტვინები

ყველა ორგანიზაციას სჭირდება ადამიანი, რომელსაც შეუძლია წარმატებით მოახდინოს მონაცემების დიდი მოცულობის ორკესტრირება სხვადასხვა წყაროდან და უზრუნველყოს, რომ შესაბამისი, განხილული და სტრატეგიული გადაწყვეტილებები მომდინარეობს ამ მონაცემებიდან. მაგრამ ვინ არიან ეს ადამიანები და სად შეიძლება მათი პოვნა?

CSC-ის თანახმად, ორგანიზაციების 57 პროცენტი ამტკიცებს, რომ მათ ჰყავთ „მონაცემთა მეცნიერები, მათემატიკოსები ან შაბლონების ტრეკერები თავიანთ IT დეპარტამენტში ან მთელ თავიანთ ორგანიზაციაში“. ეს კარგი ამბავია - IT ორგანიზაციებს სჯერათ, რომ მათ ჰყავთ შესაბამისი ხალხი. თუმცა, CIO-ების მხოლოდ 23 პროცენტი ამბობს, რომ IT ეხმარება ბიზნესს გაიზარდოს „როგორც წყალი ზრდის ყვავილებს“, როგორც ამას CSC ამბობს.

ანალიტიკოსთა ფირმა McKinsey-ის თანახმად, რაც მსოფლიოს სჭირდება მეტი ტვინი - ან "ღრმა ანალიტიკური ნიჭი", როგორც ისინი ამბობდნენ. ორი წლის წინ მაკკინსიმ შეხედა რა იყო საჭირო ნიჭის თვალსაზრისით. მათმა მოხსენებამ განიხილა ინდუსტრიები აერონავტიკიდან საბითუმო ვაჭრობამდე და იკითხა რა როლები აკისრიათ მათ, რაც საჭიროებდა შევსებას. აქტუარებს, ეპიდემიოლოგებს, მათემატიკოსებს და სამრეწველო ინჟინრებს შორის იყო ერთი როლი, რომელიც ყველა ინდუსტრიას მუდმივად სჭირდებოდა: ოპერატიული კვლევის ანალიტიკოსები. მსოფლიოს სჭირდება ადამიანები, რომლებსაც შეუძლიათ აზროვნება, დაასკვნეს ანალიტიკოსებმა.

დიდი მონაცემები: წიგნის მიმოხილვა

დიდი მონაცემები: წიგნის მიმოხილვა

წაიკითხე ახლა

მაგრამ არის პრობლემა. ყველა თანხმდება, რომ დიდ ბრიტანეთში, ისევე როგორც სხვაგან, ჩვენ არ გვჭირდება მხოლოდ გონების მქონე ადამიანები - ჩვენ გვჭირდება ადამიანები სწორი ტიპის ტვინით. მაგრამ ყველა თანხმდება იმაზეც, რომ ჩვენ გვაქვს სწორი ანალიტიკური უნარების დეფიციტი და არავინ არის შეთანხმებული, თუ როგორ უნდა მოგვარდეს ეს პრობლემა.

მაგრამ კიდევ ერთხელ, დღევანდელი ანალიტიკოსების აზრით, ეს სულაც არ არის ერთადერთი პრობლემა. ამ თვის დასაწყისში, NewVantage Partners-მა მოამზადა მოხსენება დიდი მონაცემების შესახებ, სადაც ნათქვამია, რომ მთელი ეს საკითხი IT ინდუსტრიას სერიოზულ შერყევას გამოიწვევს - მიუხედავად ზოგიერთი ცინიკური სულის მტკიცებისა. რომ დიდი მონაცემები დიდი სისულელეა.

NewVantage-ის თანახმად, „დიდი მონაცემები განსხვავდება ტრადიციული მიდგომებისგან კვანტური ნახტომით ხელმისაწვდომობით, მასშტაბით და ანალიტიკის მრავალფეროვნებით, რომელსაც შეუძლია მხარი დაუჭიროს“. გამოკითხვამ აჩვენა, რომ აღმასრულებელთა 91 პროცენტს სჯერა, რომ მათ ორგანიზაციას აქვს დაგეგმილი ან მიმდინარეობს დიდი მონაცემების ინიციატივა. მათგან 60 პროცენტმა განაცხადა, რომ სულ მცირე ერთი დიდი მონაცემთა ინიციატივა განხორციელდა, 32 პროცენტი აცხადებს, რომ სრულად ფუნქციონირებს ინიციატივას.

მაგრამ რას თვლიან გამოკითხული აღმასრულებლები დიდი მონაცემებით? უმეტესობა აღწერს მას, როგორც "მონაცემთა იმდენად დიდი, რთული ან ისეთ სწრაფ დამუშავებას საჭირო კრებულს, რომ [ის] ძალიან რთული ან შეუძლებელი ხდება მუშაობა მონაცემთა ბაზის სტანდარტული მართვის ან ანალიტიკური გამოყენებით გადაწყვეტილებები".

როგორც მოსალოდნელი იყო, აღმასრულებლები თვლიან, რომ დიდი მონაცემები იზრდება. კვლევის მიხედვით, 68 პროცენტი ელის, რომ მათი ორგანიზაციები 1 მილიონ დოლარზე მეტ ინვესტიციას განახორციელებენ დიდში 2013 წლის მონაცემები, მაგრამ ეს სწრაფად გაიზრდება და 88 პროცენტს სჯერა, რომ ის ამ მაჩვენებელს მიაღწევს 2016.

ერთი წლის წინ, აღმასრულებელთა უმეტესობამ დაასახელა მონაცემთა უფრო მრავალფეროვანი წყაროების ინტეგრაციის აუცილებლობა, როგორც მათი ძირითადი მოთხოვნა. წლევანდელმა გამოკითხვამ აჩვენა თითქმის თანაბარი განაწილება მონაცემთა მეტი წყაროს ინტეგრირებას შორის, უფრო დიდი მოცულობის მონაცემების გაანალიზებით და ანალიტიკური სიჩქარე - სიჩქარე, რომლითაც ორგანიზაციებს შეუძლიათ მიიღონ პასუხები კრიტიკულ ბიზნეს კითხვებზე - მათ შორის მთავარი მოთხოვნები.

მაგრამ უპირველეს ყოვლისა, NewVantage-ის გამოკითხვამ თქვა, რომ სიჩქარე იყო უპირველესი მოთხოვნა - ან, როგორც ანალიტიკოსებმა თქვეს, პასუხის დროის (TTA) დაჩქარება. „ბიზნესის წარმატების უზრუნველსაყოფად ყველაზე დიდი ფაქტორი, რომელსაც არაერთხელ მოიხსენიებენ აღმასრულებელი რესპონდენტები, არის უკეთესი, ფაქტებზე დაფუძნებული გადაწყვეტილებების მიღების უნარი. და გააცნობიეროს ეს უნარი იმ სიჩქარის აჩქარებით, რომლითაც ორგანიზაციებს შეუძლიათ მიიღონ ინფორმაცია და უპასუხონ კრიტიკულ ბიზნეს კითხვებს", - გამოკითხვა განაცხადა. "TTA-ის დაჩქარების შესაძლებლობა არის ბიზნესის წარმატების მეტრიკა."

ასევე, კვლევის მიხედვით, ორგანიზაციები ეძებენ „ახალ როლებსა და პროცესებს წარმატებული შვილად აყვანის უზრუნველსაყოფად“. კვლევის მიხედვით, ერთ-ერთი შედეგი იქნება მონაცემთა მთავარი ოფიცრის (CDO) ზრდა, 48 პროცენტმა დაადგინა ერთი ან ერთის განხილვა და ახალი პროცესების და ორგანიზაციული სტრუქტურების დანერგვა CDO-ების ჩათვლით წარმატებული ბიზნესის უზრუნველსაყოფად შვილად აყვანა.

ანალიტიკოსმა ფირმა Gartner-მა ჩაატარა ბევრი კვლევა დიდ მონაცემებზე და თვლის, რომ მიუხედავად იმისა, რომ ტერმინი ყოვლისმომცველია, ის სინამდვილეში შეცდომაში შეჰყავს. „ჩვენ არ ვართ კმაყოფილი ტერმინით „დიდი მონაცემები““, ამბობს გარტნერის ვიცე-პრეზიდენტი ფრენკ ბუტენდიკი. „ეს არის შეცდომაში შემყვანი და არ არის გამოსადეგი. ამ ზონაში ბევრი სხვადასხვა სტრიქონია. IT ორგანიზაციები მიჩვეულები არიან თავიანთ ყოველდღიურ IT ინფრასტრუქტურასთან ან სტრუქტურებთან გამკლავებას, მაგრამ დიდი მონაცემების გასაგებად მათ შესაძლოა მათი გადახედვა დასჭირდეთ.

ადამიანები, რომლებიც საჭიროა სხვადასხვა სათაურებისა და კლასების ქვეშ არიან, მაგრამ, როცა საქმე ეხება საქმეს, არიან ადამიანები, რომლებსაც შეუძლიათ აზროვნება - და განსაკუთრებით შეუძლიათ სტრუქტურირებული აზროვნება. ეს შეიძლება იყოს ერთ-ერთი საკითხი, რომელიც განსაზღვრავს მომავალ ათწლეულს.

Gartner აჯამებს საკითხს ოთხ სათაურში, V-ში: მოცულობა, მრავალფეროვნება, სიჩქარე და ვიზუალიზაცია. მოცულობა ეს ყველაფერი ეხება სისტემების მასშტაბირებას მათი სიმძლავრის ოპტიმიზაციისთვის. მრავალფეროვნება უზრუნველყოფს, რომ სისტემებს შეუძლიათ გაუმკლავდნენ მონაცემთა მოდელების უზარმაზარ მრავალფეროვნებას, რომლებიც დღეს გამოიყენება ინტერნეტის წყალობით. სიჩქარე ამზადებს ორგანიზაციის სხვადასხვა სტრუქტურებს - ორგანიზაციულ ასევე ფიზიკურს - რათა შეძლოს სიტუაციებთან სასწრაფოდ გამკლავება. ვიზუალიზაცია აღიარებს დღეს გამოყენებული შეყვანის ინფორმაციის უზარმაზარ რაოდენობას, რაც თავის მხრივ ზეწოლას ახდენს ორგანიზაციებზე სწრაფი, ლაკონური ინფორმაციის წარმოებისთვის.

„ადრე იყო, რომ ორგანიზაციები ინფორმაციას სტრუქტურირებულად ექცეოდნენ, რადგან ასე მუშაობდნენ ორგანიზაციები“, - ამბობს ბუტენდიკი. „ახლა მათ უწევთ საქმე სტრუქტურირებულ და არასტრუქტურირებულ ინფორმაციას უზარმაზარი მრავალფეროვანი წყაროებიდან“.

მაგრამ IT ინდუსტრიის ერთ-ერთი ყველაზე დიდი პრობლემა არის სწორი უნარების ნაკლებობა, ამბობს ბუტენდიკი. „ეს ყველამ იცის. არსებობს სხვადასხვა შეფასებები, მაგრამ ჩვენ ვფიქრობთ, რომ IT და მასთან დაკავშირებული ინდუსტრიები დაახლოებით მილიონზე მეტი ადამიანით ჩამორჩება. ”

ადამიანები, რომლებიც საჭიროა სხვადასხვა სათაურებისა და კლასების ქვეშ არიან, მაგრამ, როცა საქმე ეხება საქმეს, არიან ადამიანები, რომლებსაც შეუძლიათ აზროვნება - და განსაკუთრებით შეუძლიათ სტრუქტურირებული აზროვნება. ეს შეიძლება იყოს ერთ-ერთი საკითხი, რომელიც განსაზღვრავს მომავალ ათწლეულს. ჩვენ გვჭირდება უფრო და უფრო მეტი ადამიანი და ისინი უნდა იყვნენ უფრო ჭკვიანები - და არა მხოლოდ ჭკვიანები, არამედ ჭკვიანები სწორი გზებით.

ჩვენ ამას უკვე ვხედავთ პერიოდულ სიუჟეტში სისტემის ხარვეზის შესახებ, რომელიც უნდა მოგვარებულიყო დღეზე ნაკლები, ახლა რამდენიმე დღე სჭირდება, რადგან კომპანიები ებრძვიან დიდ სისტემებს კომპლექსი. როგორ უმკლავდება ამას ინდუსტრია, განუვითარებელი ამბავი იქნება.