თითქმის ყოველდღე ვიგებთ სიახლეებს ხელოვნური ინტელექტის (AI) შესახებ, თავის მხრივ ამ სფეროს განვითარებამ უამრავი ახალი ტერმინი გააჩინა. თუ გსურთ უკეთ გაიგოთ რას ნიშნავს და როგორ მუშაობს ხელოვნური ინტელექტი, საჭიროა გესმოდეთ ხელოვნური ინტელექტის სხვადასხვა ტიპები (artificial narrow intelligence [ANI], artificial general intelligence [AGI], და artificial super intelligence [ASI]) და მათ შესაქმნელად გამოყენებული სხვადასხვა ტექნიკები (როგორიცაა მანქანური სწავლება (machine learning) და deep learning).
მიუხედავად იმისა, რომ თითოეული ტერმინის განმარტებას მთელი ლექსიკონი დასჭირდება, მაინც ვცადე და ყველაზე მნიშვნელოვანი ტერმინები განვმარტე.
რა არის ხელოვნური ინტელექტი?
ტერმინი „ხელოვნური ინტელექტი“ 1956 წელს ჯონ მაკკარტიმ შემოიტანა,
მაკკარტიმ განმარტა AI, როგორც “ინტელექტუალური მანქანების შექმნის მეცნიერება და ინჟინერია”.
თუმცა, როგორც კონკრეტული ტექნიკური ტერმინი, ხელოვნური ინტელექტი, ნამდვილად ცუდად არის განსაზღვრული და სრულად არ ასახავს მის შესაძლებლობებს.
სწორედ ამიტომ გაჩნდა ხელოვნური ინტელექტის უფრო აღწერილობითი ტერმინები (artificial narrow intelligence [ANI], artificial general intelligence [AGI], და artificial super intelligence [ASI]), რომლებიც სრულად ასახავენ მის შინაარსს. მაგალითად, ბევრად უფრო ადვილია დავასკვნათ, რომ ChatGPT არის artificial narrow intelligence [ANI] – AI სისტემა, რომელიც შექმნილია კონკრეტული ამოცანების შესასრულებლად, მას არ გააჩნია ზოგადი ინტელექტი და ადამიანის დონეზე ფართო სპექტრისა და ამოცანების შესრულების უნარი. ChatGPT სპეციალიზირებულია ბუნებრივი ენის გაგებასა და გენერირებაში, რაც მას ხდის მნიშვნელოვან რესურსს ტექსტზე დაფუძნებულ საუბრებში, მაგრამ შეზღუდულია ადამიანის ინტელექტთან შედარებით.
რაც შეეხება General intelligence-ს და Super intelligence-ს: AGI, თავის მხრივ, წარმოადგენს AI-ის ტიპს, რომელიც ფლობს ადამიანის დონის ინტელექტს და შეუძლია შეასრულოს კოგნიტური ამოცანების ფართო სპექტრი ადამიანებთან შესადარებელ დონეზე, ხოლო ხელოვნური სუპერინტელექტი (ASI) ეს არის ხელოვნური ინტელექტის ჰიპოთეტურ ფორმა, რომელიც აღემატება ადამიანის ინტელექტს ყველა ასპექტში.
რაც შეეხება ზოგად განმარტებს, უმეტეს შემთხვევაში, როდესაც ჩვენ ვსაუბრობთ ხელოვნურ ინტელექტზე, ჩვენ ვგულისხმობთ ტექნოლოგიას, რომლებსაც შეუძლიათ, გარკვეულწილად, “ფიქრი”.
რა არის მანქანური სწავლება (Machine Learning)?
მანქანური სწავლება შეგვიძლია მივიჩნიოთ ხელოვნური ინტელექტის ქვედარგად.
წარმოვიდგინოთ, რომ ჩვენ ვქმნით კომპიუტერულ პროგრამას, რომელსაც შეუძლია განსაზღვროს ნებისმიერი საგანი არის თუ არა ძაღლი. ამის გაკეთების ერთ-ერთი გზა იქნება გარკვეული პირობების შექმნა, რომლებიც აპლიკაციას შეუძლია გამოიყენოს ძაღლების იდენტიფიცირებისთვის:
- ოთხი ფეხი აქვს?
- აქვს თუ არა მას ორი ყური (ფლოპი ან სადგამი)?
- ორი თვალი აქვს?
- კუდი აქვს თუ არა?
- და ასე შემდეგ
რა თქმა უნდა, ამ ტიპის პროგრამას დიდი პრობლემები ექნება, ჩვენ შეიძლება დავწეროთ საკმარისი პირობები, მაგრამ ყველა პირობას ვერ გავითვალისწინებთ და რაღაც გამოგვრჩება.
მანქანური სწავლების შემთხვევაში სხვა სურათია, წინასწარ პირობების დაწერის ნაცვლად, ჩვენ დავწერთ ალგორითმს, რომელიც აპს საშუალებას აძლევს შექმნას საკუთარი პირობები. შემდეგ ჩვენ შეგვიძლია ვაჩვენოთ ათასობით ძაღლის სურათი და აპლიკაცია თავადვეისწავლის განსხვავებას ძაღლსა და სხვა ნივთებს შორის.
რა თქმა უნდა, ეს მაგალითი ძალიან გამარტივებულია, პროცესი ბევრად რთულია, მაგრამ მაინც გვაძლევს წარმოდგენას იმის შესახებ თუ რას აკეთებს მანქანური სწავლება.
რომ შევაჯამოთ, მანქანური სწავლების დახმარებით შეგვიძლია შევიმუშოთ ალგორითმები, რომლებიც გაანალიზებენ და ისწავლიან გარკვეული მონაცემებიდან და მიიღებენ გადაწყვიტლებებს ამ მონაცემებზე დაყრდნობით.
რისთვის გამოიყენება მანქანური სწავლება?
მანქანური სწავლების მაგალითები თითოეული ჩვენგანის რეალურ ცხოვრებაში ყოვდღიურად გვხვდება, მაგალითად: სარეკომენდაციო ალგორითმები Amazon-ზე, Netflix-ზე და სხვა ვებსაიტებზე, სპამის ფილტრები Gmail-ში და ელფოსტის სხვა აპებში.
მანქანური სწავლების ტიპები
ზოგადად, არსებობს მანქანური სწავლის სამი ტიპი:
Supervised learning იყენებს სტრუქტურირებულ, ეტიკეტირებულ მონაცემთა ნაკრებს. ამ ტიპით შემუშავებულ მოდელებს შეუძლიათ პროგნოზების გაკეთება და საგნების კატეგორიზაცია.
Unsupervised learning იყენებს არაქსტრუქტურიზებულ მონაცემთა ნაკრებს. ამ ტიპის მოდელებს შეუძლიათ ამოიცნონ შაბლონები და დაჯგუფონ საგნები მათი განმასხვავებელი მახასიათებლების მიხედვით.
Reinforcement learning -ს დროს მოდელი სწავლობს იყოს უფრო ზუსტი.
მოკლედ ეს არის მანქანური სწავლევა, მაგრამ მოდით კიდევ უფრო ჩავუღრმავდეთ
რა არის ღრმა სწავლება (Deep Learning)?
ღრმა სწავლება არის მანქანური სწავლების ქვედარგი.
ღრმა სწავლის ალგორითმები შექმნილია იმისთვის, რომ ავტომატურად ისწავლონ და ამოიღონ იერარქიული მახასიათებლები და გამოსახულებები მონაცემებიდან, რაც მათ განსაკუთრებით შესაფერისს ხდის ისეთი ამოცანებისთვის, როგორიცაა გამოსახულების და მეტყველების ამოცნობა, ბუნებრივი ენის დამუშავება და სხვა სხვადასხვა სფეროები.
ღრმა სწავლაში „ღრმა“ გულისხმობს ღრმა ნეირონული ქსელების გამოყენებას, რომლებიც შედგება ურთიერთდაკავშირებული კვანძების ან ნეირონების მრავალი ფენისგან. თითოეული ფენა ასრულებს კონკრეტულ მათემატიკურ ოპერაციას და შედეგებს გადასცემს შემდეგ ფენას.
ღრმა სწავლება წარმატებით გამოიყენება სხვადასხხვა აპლიკაციებში, მათ შორის გამოსახულების და ვიდეო ანალიზის, ბუნებრივი ენის დამუშავების, რეკომენდაციების სისტემებში, ავტონომიურ სატრანსპორტო საშუალებებში და სხვა. ის კვლავ რჩება კვლევისა და განვითარების აქტიურ სფეროდ, რაც ხელს უწყობს AI ტექნოლოგიების მიღწევებს.
რა არის ნეირონული ქსელი (neural networks)?
ხელოვნური ნეირონული ქსელები (ANNs) არის ერთგვარი კომპიუტერული ალგორითმი, რომელიც მოდელირებულია ადამიანის ტვინიდან და ისინი, როგორც წესი, იქმნება მანქანური სწავლების ან ღრმა სწავლების გამოყენებით.
ANN შედგება “კვანძების” ფენებისგან, რომლებიც დაფუძნებულია ნეირონებზე. არსებობს შემავალი ფენა, გამავალი ფენა და ერთი ან მეტი ფარული ფენა, სადაც ხდება გამოთვლების უმეტესი ნაწილი.
თითოეულ კვანძს აქვს წონა, ზღვრული მნიშვნელობა და აკავშირებს შემდგომ კვანძებს შემდეგ ფენაში. როდესაც ზღვრული მნიშვნელობა გადააჭარბებს, ის ააქტიურებს და აგზავნის მონაცემებს კვანძების შემდეგ კომპლექტზე; თუ ზღვრული მნიშვნელობა არ არის გადაჭარბებული, ის არ აგზავნის მონაცემებს. წონა განსაზღვრავს, თუ რამდენად მნიშვნელოვანია კონკრეტული კვანძის სიგნალი სხვა კვანძების გააქტიურებისას.
მოდით დავუბრუნდეთ ჩვენს ძაღლის ამომცნობ აპლიკაციას. ჩვენმა მანქანურმა სწავლებამ შექმნა ნეირონული ქსელი, რომელსაც შეუძლია განსაზღვროს რა არის და რა არ არის ძაღლი. კვანძის ერთ-ერთ შრეში იქნება ლაქების ამომცნობი კვანძი, მეორე კვანძი იქნება კუდის ამომცნობი და ა.შ.
როდესაც მას ვაჩვენებთ საყვარელი ძაღლის ფოტოს, რომელსაც აქვს ლაქები, შესაბამისი მნიშვნელობის კვანძი გააქტიურდება და გადასცემს სიგნალს შემდეგ კვანძს თანმიმდევრობით. თუ კუდის ამომცნობი კვანძი, ლაქების ამომცნობი კვანძი და ოთხი ფეხის საიდენტიფიკაციო კვანძი გააქტიურებულია, მაშინ ნეირონული ქსელი გამოსცემს ძლიერ „ძაღლის“ სიგნალს. მეორეს მხრივ, თუ ნეირონულ ქსელს მივცემთ რამდენიმე ყვავილის ფოტოს, ძაღლის იდენტიფიკაციის თითქმის არცერთი კვანძი არ გააქტიურდება, ამიტომ მოდელი გამოსცემს ძლიერ სიგნალს “არ არის ძაღლი”.
ისევ და ისევ, ეს არის უაღრესად გამარტივებული მაგალითი – ჩვენი მიზანიც ეგ არის, მარტივად ავღწეროთ ის თუ რა ხდება AI-ზე დაფუძნებული მრავალი ხელსაწყოს შიგნით. მაგალითად, GPT-3-ს აქვს კვანძების 96 ფენა და 175 მილიარდი პარამეტრი,შესაბამისად მარტივი ძაღლის ამოცნობის მაგალითზე გაგვიჭრდება აღნიშნული მოდელის აღწერა 🙂
მოგეწონა სტატია?