პროგნოზირებადი ანალიტიკა და მანქანათმცოდნეობა: დინამიური დუეტი

  • Oct 23, 2023

პროგნოზირებადი ანალიტიკა და მანქანათმცოდნეობა განიხილება, როგორც წყვილი ხელსაწყოები, რომლებიც დღესდღეობით უმრავლეს ორგანიზაციას ეხმარება. ჩვენ ვცდილობთ ორივეს დემისტიფიკაციას ვაკვირდეთ, რა არის ისინი, როგორ მუშაობენ და რისთვის არიან კარგი.


პროგნოზირებადი ანალიტიკა და მანქანათმცოდნეობა ცალ-ცალკე ან ერთად მუშაობს მხოლოდ ის, რაც კომპანიას სჭირდება წარმატებისთვის. მაგრამ იმის გაგება, თუ როგორ მუშაობენ ისინი, არის გასაღები იმის გასარკვევად, თუ როგორ შეუძლიათ დაეხმარონ ბიზნესს განვითარებაში.

მაშ, რა არის პროგნოზირებადი ანალიტიკა? Datafloq-ის Mark van Rijmenam იყენებს მანქანის მეტაფორას, რომლის მიხედვითაც ტრადიციული, აღწერილობითი ანალიტიკა ჰგავს უკანა ხედვის სარკეში ყურებას იმის სანახავად, რაც მოხდა, ხოლო პროგნოზირებადი ანალიტიკა არის ნავიგაციის სისტემის გამოყენებით, რომ გითხრათ, რა მოხდება, და რეცეპტური ანალიტიკა არის თვითმართვადი მანქანა, რომელმაც იცის, როგორ მიგიყვანოთ დანიშნულების ადგილამდე.

ეს მეტაფორა, მიუხედავად იმისა, რომ ადვილი გასაგებია, შეიძლება ასევე იყოს მოტყუებით მარტივი. ის, რა თქმა უნდა, ღიაა ინტერპრეტაციისთვის, ამიტომ კარგი საწყისი წერტილია განხილვისთვის. ზოგიერთმა შეიძლება თქვას, რომ სანავიგაციო სისტემას სავარაუდოდ აქვს წვდომა ყველა მონაცემზე პოტენციური მარშრუტების შესახებ. მაშ, არის თუ არა ამ მონაცემებზე დაფუძნებული მარშრუტის შეთავაზება ნამდვილად წინასწარმეტყველება? არ არის ეს რაღაც ალგორითმული, განმსაზღვრელი და ამდენად ნამდვილად არ არის "ინტელექტუალური"? თუ ეს არის განმარტებების საკითხი - სემანტიკა?

ეს დამოკიდებულია იმაზე, თუ როგორ არის განსაზღვრული სანავიგაციო სისტემა და როგორ მუშაობს იგი. როგორც წესი, სანავიგაციო სისტემები არ ცდილობენ წინასწარ განსაზღვრონ სად გინდა წასვლა დღეს. ამის ნაცვლად, ისინი ელიან კონკრეტული ინსტრუქციების მიღებას და შემდეგ გაერკვნენ, როგორ მიიღონ წერტილი A (ან აშკარად მოცემულია, როგორც საწყისი წერტილი, ან გამოითვლება GPS გეო-მდებარეობის გამოყენებით) B წერტილამდე.

მოდით განვიხილოთ სხვა მაგალითი: ინტერნატის კარიბჭის წამკითხველები (BGRs). BGR-ებს შეუძლიათ მიუთითონ, უნდა მიენიჭოს თუ არა გარკვეულ პირს წვდომა აეროპორტის გარკვეულ ტერიტორიაზე გარკვეულ დროს. არატექნიკური ადამიანებისთვის ეს ისეთივე მისტიურია, როგორც სანავიგაციო სისტემა: როგორ "იცის" სისტემამ რა გააკეთოს, რა არის სწორი პასუხი/მოქმედება?

ტექნიკოსებისთვის, ორივე მაგალითი არ არის დასაწერი: არის მონაცემთა ბაზა ყველა ინფორმაციით (ქუჩები და დისტანციები, მგზავრების სიები), არის ალგორითმი, რომელიც განსაზღვრავს გამოსავალს. მოცემული შეყვანისთვის (ყველაზე სწრაფი მარშრუტი A-დან B-მდე, არის თუ არა მგზავრი X სიაში Y ფრენისთვის), არის საშუალება, რომელიც აკავშირებს სისტემას გარე სამყაროსთან (GPS პოზიცია, შტრიხ-კოდი მკითხველი). სინამდვილეში, არცერთ სისტემაში არ არსებობს რეალური პროგნოზი.

როდესაც ამ ლინზების ქვეშ შევხედავთ, ეს სისტემები შეიძლება განსხვავდებოდეს განხორციელების დეტალებისა და ალგორითმებისა და მონაცემების სირთულის მიხედვით, მაგრამ ისინი ფუნდამენტურად არც ისე შორს არიან ერთმანეთისგან. მიუხედავად ამისა, მიუხედავად იმისა, რომ ტექნოლოგიური ინდუსტრიის რამდენიმე ადამიანი კლასიფიცირებს BGR-ს, როგორც პროგნოზირების სისტემას, სავარაუდოდ, ზოგი ამას გააკეთებს სანავიგაციო სისტემისთვის. არის თუ არა ის ფაქტი, რომ BGR-ები პასუხობენ ორობითი (წვდომის/დაშვების გარეშე) პასუხით, ხოლო ნავიგატორი პასუხობს კონკრეტული ინსტრუქციებით განმასხვავებელ ფაქტორს?

მანქანური სწავლება გამარჯვებისთვის?

არის მაგია მანქანათმცოდნეობაში?

სპეციალური თვისება

IoT: უსაფრთხოების გამოწვევა

ნივთების ინტერნეტი უსაფრთხოების ახალ რისკებს ქმნის. ჩვენ განვიხილავთ შესაძლებლობებსა და საფრთხეებს.

წაიკითხე ახლა

ამაზე პასუხის გასაცემად, მოდით შევხედოთ სხვა მაგალითს: მავნე პროგრამის იდენტიფიცირება. როგორც აღწერილია კასპერსკის მიერ ალექსეი მალანოვიადრე, ეს შესაძლებელი იყო საკმაოდ მარტივი ალგორითმებისა და წესების გამოყენებით. რაღაც მომენტში, საძიებო სივრცე (ანუ პოტენციური მავნე პროგრამის იდენტიფიცირება) იმდენად დიდი გახდა და დაიწყო ფართოვდება ისე სწრაფად, რომ ძალიან რთული იყო წესების შემუშავება, რომლებიც მას მთლიანად დაფარავს და დაიცავს მას თარიღი. აქედან გამომდინარე, შეიყვანეთ მანქანური სწავლება (ML).

მალანოვი გვიჩვენებს, თუ როგორ შეიძლება გამოყენებულ იქნას ML იგივე ამოცანის შესასრულებლად - მავნე პროგრამის იდენტიფიცირება - უფრო ეფექტურად. არსი, თუ როგორ მუშაობს ეს, არის ალგორითმის გამოყენება, რომელიც ახორციელებს ევრისტიკულ წესებს დაფუძნებული მეტრიკაზე (ამ შემთხვევაში, ასოების თანმიმდევრობის სიხშირეზე) და კურირებულ მონაცემთა ბაზას ალგორითმის მომზადებისთვის. პროცესი განსხვავებულია, გზაზე საკმაოდ ბევრი შეცდომაა, მაგრამ საბოლოო შედეგი ძირითადად ერთი და იგივეა: შეყვანის შესაძლებლობაზე პასუხის გაცემა malware/არა მავნე პროგრამის ორობითი პასუხით.

ასე რომ, ნავიგატორი სულ სხვაა? ორი მაგალითი იზიარებს გარკვეულ მსგავსებას - მათ აქვთ დიდი საძიებო სივრცე და ალგორითმების შემუშავება მისი მთლიანობის დასაფარად საკმაოდ რთულია. მალანოვის მაგალითი გვიჩვენებს, თუ როგორ მუშაობს ML ალგორითმი, როგორც ფუნქცია, რომელიც კლასიფიცირებს შეყვანას ბინარულ გამომავალში. იგივე პრინციპი შეიძლება გავრცელდეს არაორობით შედეგებზე, როგორიცაა მარშრუტის არჩევა A-დან B-მდე.

ეს რეალურად ოპტიმიზაციის პრობლემაა. A-დან B-მდე მისასვლელად ოპტიმალური გადაწყვეტა იქნება სწორი ხაზით მოძრაობა 2 წერტილს შორის. თუმცა ეს შეუძლებელია, რადგან არის მხოლოდ გარკვეული მარშრუტები, რომლებიც გთავაზობთ შეუფერხებელ წვდომას A-დან B-მდე. ამის მიახლოების ერთ-ერთი გზა იქნება წესების დაშიფვრა, რომელიც განსაზღვრავს რა არის და რა არ არის შესაძლებელი მართვის დროს და შემდეგ გამოიყენეთ ნავიგატორის მონაცემთა ბაზა წესებთან ერთად, რათა გაარკვიოთ რა არის საუკეთესო გზა იქ.

იგივე პრობლემასთან მიახლოების ML გზა იქნება მონაცემების მიღება მარშრუტების შესახებ, რომლებსაც ადამიანები გამოიყენებდნენ A-დან B-მდე გასასვლელად და მისი გამოყენება ალგორითმის მოსამზადებლად. ამ შემთხვევაში, შეიძლება არსებობდეს მრავალი ალტერნატივა ერთი და იმავე მარშრუტისთვის, ამიტომ უბრალოდ „დიახ/არა“ პასუხის გაცემა არ გამოდგება. მაგრამ იგივე პრინციპი შეიძლება გამოვიყენოთ შეყვანის ორზე მეტ პოტენციურ ურნაში გამოსავლის კლასიფიკაციისთვის - რაც ცნობილია ML ტერმინოლოგიაში, როგორც მრავალკლასიანი კლასიფიკაცია. პოტენციური მარშრუტების გამარტივებული კლასიფიკაცია შეიძლება იყოს „შეუძლებელი“, „ცუდი“, „კარგი“ ან „ოპტიმალური“.

პროგნოზები რთულია, განსაკუთრებით მომავლის შესახებ

რომელ ML მოდელს შეუძლია ამის პროგნოზირება? სურათი: investing.com / Business Insider

თუმცა, სავარაუდოდ, ნავიგატორების უმეტესობა არ მუშაობს ML-ის გამოყენებით - ყოველ შემთხვევაში არა მათი ძირითადი ფუნქციისთვის. მალანოვი ეხება ზოგიერთ მიზეზს, რის გამოც ML არ არის პანაცეა: ცრუ დადებითი, მოდელის შემოვლითი, მოდელის განახლება. მართალია, ეს შეიძლება რეალურად არ იყოს ML გამოყენების ყველაზე სერიოზული ნაკლი. როგორც ჩანს, ამჟამად ფართოდ გავრცელებული მცდარი წარმოდგენა არსებობს, რომ ML არის ის, რაც ავტომატურად მუშაობს უპრობლემოდ - თქვენ უბრალოდ უნდა გადაყაროთ მონაცემები. მაგრამ როგორც AI2-ის ორენ ეციონმა თქვა, "მანქანური სწავლების 99% ადამიანის შრომაა."

არის ადამიანის მუშაობა ჩართული ამოცანისთვის სწორი ალგორითმების პოვნაში, შემუშავებაში, შერჩევასა და გაერთიანებაში. ხელით, მონაცემთა ნაკრების პოვნაში და სათანადო ეტიკეტირებაში, ალგორითმების მომზადებისთვის, სისტემის პარამეტრების დახვეწაში და ა.შ. on. მაგრამ არანაკლებ მნიშვნელოვანია, არის შემთხვევები, რომლებისთვისაც ML არის შესანიშნავი ინსტრუმენტი, სხვები, რომლებისთვისაც ის არასათანადოა და სხვები, რომლებისთვისაც საჭიროა მისი შერწყმა სხვა ტექნიკასთან.

ნავიგატორის მაგალითში, ერთი იდეა იქნება ML-ის გამოყენება, რათა იწინასწარმეტყველოთ, სად სურთ მომხმარებლებს წასვლა, მათი საწყისი წერტილისა და საერთო მარშრუტების საფუძველზე, რომლებიც იწყება იქ. მაგრამ მნიშვნელოვანია გვესმოდეს, რომ პროგნოზების ხარისხი დამოკიდებულია უამრავ ფაქტორზე: რამდენად დიდი და მრავალფეროვანი გვაქვს მონაცემთა ნაკრები (თუ მხოლოდ რამდენიმე ხალხი იყენებს სისტემას და მიდიან მხოლოდ სახლიდან სამსახურში და უკან, ეს არის ისეთ "პროგნოზებს" ჩვენ მივიღებთ), რა სახის პარამეტრებს ვაფასებთ ჩვენი პროგნოზირების მოდელი (დღის დროის გამოყენება ალბათ კარგი იდეაა, მძღოლის ასაკი შესაძლოა, მანქანის ფერი ალბათ არა) და რამდენად კარგად მუშაობს ჩვენი მოდელი ჩვენი სცენარისთვის.

რაც მთავარია, მონაცემთა ნაკრების, პარამეტრების და მოდელების საუკეთესო კომბინაციაც კი არ იძლევა გარანტიას რეალურ სამყაროში, ბოროტ პრობლემებში. ცოტა ხნის წინ ვნახეთ როგორ არჩევნების შედეგების წინასწარმეტყველება მარცხი იყო მას შემდეგ, რაც პირველად სცადეს. კიდევ ერთი ცნობილი მაგალითია ფორექსის პროგნოზირება: მაშინ, როდესაც აშკარად ცენტრალური ბანკის გადაწყვეტილებები არის განმსაზღვრელი პარამეტრი აქ და, სავარაუდოდ, ყველა მოდელი, ისინი დამოკიდებულნი არიან ისეთი ხარისხობრივი და რაოდენობრივი სირთულის ფაქტორებზე, რომ მათი პროგნოზირება პრაქტიკულად შეუძლებელია შიგნით. ინფორმაცია, როგორც ახლახან აჩვენა შვეიცარიული ფრანკის საქმეში.

ყველა პრობლემა არ არის ლურსმანი მანქანათმცოდნეობის ჩაქუჩისთვის

მაგრამ იქნება თუ არა ML გამოყენება მარშრუტის პოვნის მთავარი პრობლემის საუკეთესო გამოსავალი? რატომ შედიხართ მონაცემების მოძიებაში და ალგორითმის მომზადებაში ქცევის განსახორციელებლად დომენში, რომელიც არის კარგად ესმით და შეიძლება ჩამოყალიბდეს წესების ერთობლიობამდე, რომელიც ფუნქციონირებს დამოუკიდებლად, არის თუ არა მონაცემები სხვების შესახებ გააკეთე, თავიდან აცილება ცივი დაწყება პრობლემა?

რაც შეეხება BGR-ს? BGR-ები უიმედოდ დეტერმინისტულია: ისინი პასუხობენ დიახ/არას 100 პროცენტიანი სიზუსტით - ვარაუდობენ, რომ სისტემის ყველა ნაწილი სწორად ფუნქციონირებს. და ამ შემთხვევაში, ეს კარგია. შეიძლება წარმოვიდგინოთ ML-ზე მომუშავე BGR, რომელიც ითვალისწინებს წარსულში მყოფი მგზავრების ყველა სახის თვისებას, რათა „წინასწარმეტყველოს“, აქვს თუ არა თითოეულ ახალ მგზავრს უფლება შევიდეს ჩასხდომის ზონაში. მაგრამ არის ეს ის, რაც ჩვენ ნამდვილად გვსურს რომ გვქონდეს?

რატომ ხდება ასე, როდესაც აქ მოთხოვნები მიუთითებს მარტივ მონაცემთა ბაზაზე და რამდენიმე მარტივ პროცედურულ წესზე, რომლებიც არ საჭიროებს ტრენინგს ან მარკირებას? და რა სახის ფუნქციები შეიძლება გამოიყენოს ვინმემ მგზავრების უფლებამოსილების კლასიფიკაციისთვის? ასაკი, სიმაღლე, შემოსავალი, ეთნიკური წარმომავლობა, სახის ნაკვთები? აზროვნების მსგავს ხაზებთან ერთად, ML იქნა გამოყენებული მსგავსი რამის გასაკეთებლად ადამიანების კლასიფიკაცია გარკვეულ ჯგუფებად მათი სახის მახასიათებლების მიხედვით, გამოიწვია ფართო კრიტიკა და დააბრუნა მე-19 საუკუნის მოგონებები ფრენოლოგია.

მეცნიერება, თქვენ ამბობთ? გამოსახულება: სახე

მაგალითები მიკერძოება და წარუმატებლობა ალგორითმებში ბევრია, მაგრამ მაშინაც კი, როდესაც არ არის მიყვანილი უკიდურესობამდე, ML არ არის ის, რაც მხოლოდ თავისთავად მუშაობს. ML არის კარგი გზა მონაცემების შაბლონებისა და პოტენციური კორელაციების დასადგენად, რაც დიდად დაეხმარება ადამიანებს. მაგალითად, მას შეუძლია დაეხმაროს მართლწერის საერთო შეცდომების იდენტიფიცირებას, მონაცემების ჩხუბის შაბლონებს ან თუნდაც კორელაციები მონაცემებში, რომლებიც შეიძლება იყოს ამოსავალი წერტილი ტეგირების, სქემის მართვისა და ონტოლოგიისთვის შექმნა. მაგრამ მიუხედავად იმისა, რომ ძალზე სასარგებლოა, არცერთი მათგანი ნამდვილად არ წარმოადგენს ხელოვნურ ინტელექტს (AI).

ML, თუმცა ხშირად რთული მის განხორციელებაში და შთამბეჭდავი შედეგებით, არის ალგორითმული და დეტერმინისტული. მასში ჯადოსნური არაფერია და ის, რა თქმა უნდა, არ წარმოადგენს AI-ს ამ გაგებით ხელოვნური გენერალური ინტელექტი. საუკეთესო შემთხვევაში, ის შეიძლება ჩაითვალოს სამშენებლო ბლოკად ხელოვნური ვიწრო ინტელექტი. მაგრამ ეს დეფინიციები იმსახურებს უფრო საფუძვლიან გამოკვლევას, ღრმა სწავლებასთან ერთად, ML-ის გამოყენებას სემანტიკასთან ერთად, ადამიანის მარყუჟში და გზაზე ინსტრუქციული ანალიტიკისკენ.