მონაცემთა ანალიზი არის მონაცემების შემოწმების, ფილტრაციის, ადაპტაციისა და მოდელირების პროცესი, რომელიც გვეხმარება პრობლემის გადაჭრაში. მარტივად რომ ვთქვას, მონაცემთა ანალიზი გვეხმარება იმის დადგენაში, თუ რა მუშობს კარგად და რა არა, მისი დახმარებით, თქვენ შეგიძლიათ განახორციელოთ მონაცემებზე დაფუძნებული ცვლილებები, რომლებიც საჭიროა თქვენი ბიზნეს მიზნების მისაღწევად.
გაითვალისწინეთ, რომ მონაცემთა ანალიზი მოიცავს როგორც რაოდენობრივი მონაცემების (მაგ. მოგება და გაყიდვები) ასევე თვისობრივი მონაცემების ანალიზს (მაგ. გამოკითხვები და კვლევები):
მონაცემთა რაოდენობრივი ანალიზი: მარტივად რომ ავხსნათ, წარმოიდგინეთ ონლაინ საიუველირო მაღაზიის მფლობელი, რომელიც აანალიზებს გაყიდვებს ბოლო ექვსი თვის განმავლობაში და ხედავს, რომ მოთხოვნა ოქროს სამკაულებზე საშუალოდ შეადგენდა 210 ერთეულს, ხოლო ვერცლის სამკაულებზე – 105 ერთეულს. მათ მარაგში ქონდათ მხოლოდ 100 ოქროს და 100 ვერცხლის სამკაული. შესაბამისად, მოთხოვნის ანალიზის საფუძველზე მან დაადგინა, რომ ოქროს სამკაულზე მოთხოვნის რაოდენობა 2-ჯერ მეტია, ვიდრე მარაგში არსებული სამკაულების რაოდენობა. შემდეგ ჯერზე, როდესაც მაღაზიის მფლობელი შეუკვეთავს გასაყიდ ინვენტარს, ის მოითხოვს ორჯერ მეტ ოქროს სამკაულს, რათა დააკმაყოფილოს მომხმარებლის მოთხოვნა.
თვისებრივი მონაცემების ანალიზის მაგალითი: წარმოიდგინეთ, ფიტნეს დარბაზის მფლობელი აგზავნის ღია გამოკითხვას და ეკითხება მომხმარებელს, თუ რა სახის ვარჯიშები სიამოვნებთ მათ ყველაზე მეტად. შემდეგ მფლობელი აანალიზებს კონტენტს, რათა დაადგინოს ყველაზე ხშირად შემოთავაზებული სავარჯიშოები და აერთიანებს მათ მომავალ სავარჯიშო კლასებში.
მონაცემთა ანალიზის ტიპები (მაგალითებით)
არსებობს მონაცემთა ანალიზის ხუთი ძირითადი ტიპი — თითოეული მათგანი ემსახურება განსხვავებულ მიზანს.
Text analysis: რა ხდება?
Text analysis, ასევე ცნობილი როგორც data mining, გულისხმობს ინფორმაციის ანალიზს დიდი რაოდენობით არასტრუქტურირებული, ტექსტზე დაფუძნებული მონაცემთა წყაროებიდან: ელ. ფოსტა, სოციალური მედია, სიახლეები, შეფასებები და ა.შ.
აქ მოცემულია რამდენიმე მეთოდი, რომლებიც გამოიყენება მსგავს ტიპის ანალიზის შესასრულებლად:
სიტყვების სიხშირე: ამოიცნობს ყველაზე ხშირად გამოყენებულ სიტყვებს. მაგალითად, რესტორანი მონიტორინგს უწევს სოციალური მედიის კონტენტს, შეფასებებს, კომენტარებს და ე.წ. თაგებს და ზომავს დადებითი და უარყოფითი საკვანძო სიტყვების სიხშირეს, როგორიცაა „გემრიელი“ ან „ძვირი“, რათა დადგინდეს, რას ფიქრობენ მომხმარებლები თავიანთ გამოცდილებაზე.
ენის ამოცნობა: ძირითადად გლობალური კომპანიები იყენებენ ენის ამოცნობის სისტემას და მისი დახმარებით აუმჯობესებენ მოხმარებელთა მხარდაჭერის გამოცდილებას
საკვანძო სიტყვების ამოღება: ავტომატურად ამოიცნობს ყველაზე ხშირად გამოყენებულ ტერმინებს. მაგალითად, ათასობით შეფასების გარჩევის ნაცვლად, პოპულარული ბრენდი იყენებს საკვანძო სიტყვების ექსტრაქტორს, რათა შეაჯამონ სიტყვები ან ფრაზები, რომლებიც ყველაზე აქტუალურია.
იმის გამო, რომ ტექსტის ანალიზი ემყარება სიტყვებს და არა რიცხვებს, ეს ცოტა უფრო სუბიექტურია. სიტყვებს შეიძლება ჰქონდეთ მრავალი მნიშვნელობა. ბუნებრივი ენის დამუშავების (NLP) პროგრამული უზრუნველყოფა დაგეხმარებათ მიიღოთ ყველაზე ზუსტი ტექსტის ანალიზი, მაგრამ ის იშვიათად არის ისეთივე ობიექტური, როგორც რიცხვითი ანალიზი.
სტატისტიკური ანალიზი: რა მოხდა?
სტატისტიკური ანალიზი აგროვებს წარსულ მონაცემებს მნიშვნელოვანი ტენდენციების დასადგენად. არსებობს სტატისტიკური ანალიზის ორი ძირითადი ტიპი: აღწერითი ანალიზი / Descriptive analysis და დასკვნა / inferential
აღწერითი ანალიზი / Descriptive analysis
აღწერითი ანალიზი უყურებს ციფრულ მონაცემებს და გამოთვლებს, რათა დადგინდეს რა მოხდა ბიზნესში. კომპანიები იყენებენ აღწერით ანალიზს მომხმარებელთა კმაყოფილების დასადგენად, კამპანიების ანალიზისთვის, ანგარიშების შესაქმნელად და ა.შ.
აქ მოცემულია რამდენიმე მეთოდი, რომელიც გამოიყენება აღწერითი ანალიზის შესასრულებლად:
სიხშირის ანალიზი: ეს მეთოდი განსაზღვრავს რამდენად ხშირად ხდება მოვლენა. მაგალითად, პოპულარული ყავის ქსელი აგზავნის გამოკითხვას, რომელშიც ეკითხება მომხმარებლებს, რომელია მათი საყვარელი სადღესასწაულო სასმელი და იყენებს სიხშირის გაზომვას იმის დასადგენად, თუ რამდენად ხშირად არის შერჩეული კონკრეტული სასმელი.
ცენტრალური ტენდენციის ანალიზი: აქ თქვენ იყენებთ საშუალოს, მედიანას და მოდას შედეგების დასადგენად. მაგალითად, გაცნობის აპლიკაციის კომპანიამ შეიძლება გამოიყენოს ცენტრალური ტენდენციის ანალიზი მისი მომხმარებლების საშუალო ასაკის დასადგენად.
დისპერსიის ანალიზი: ზომავს, თუ როგორ ნაწილდება მონაცემები დიაპაზონში. მაგალითად, HR შეიძლება გამოიყენოს დისპერსიის ანალიზი, რათა დადგინდეს რა ხელფასი შესთავაზოს მოცემულ სფეროში კანდიდატს.
დასკვნა / inferential
დასკვნის ტიპის ანალიზი იყენებს მონაცემთა ნიმუშს გაცილებით დიდი პოპულაციის შესახებ დასკვნების გამოსატანად.
აქ მოცემულია რამდენიმე მეთოდი, რომლებიც გამოიყენება მსგავსი ტიპის ანალიზის დროს:
ჰიპოთეზის ტესტირება: განსაზღვრავს რომელი ცვლადები ახდენენ გავლენას კონკრეტულ თემაზე. მაგალითად, ბიზნესი იყენებს ჰიპოთეზის ტესტირებას იმის დასადგენად, იყო თუ არა გაზრდილი გაყიდვები კონკრეტული მარკეტინგული კამპანიის შედეგი.
ნდობის ინტერვალები: მიუთითებს რამდენად ზუსტია შეფასება. მაგალითად, კომპანიას, რომელიც გამოკითხვის შედეგად აგროვებს ინფორმაციას მათი პროდუქტის შესახებ, შეიძლება სურდეს იმის დადგენა, თუ რამდენად წარმოადგნენ გამოკითხული პირები მათ სამიზნე ბაზარს.
რეგრესიული ანალიზი: აჩვენებს დამოუკიდებელი ცვლადების გავლენას დამოკიდებულ ცვლადზე. მაგალითად, მანქანის დაქირავებულმა კომპანიამ შეიძლება გამოიყენოს რეგრესიის ანალიზი, რათა დადგინდეს კავშირი ლოდინის დროსა და ცუდი შეფასებების რაოდენობას შორის.
სადიაგნოსტიკო ანალიზი / Diagnostic analysis: რატომ მოხდა ეს?
სადიაგნოსტიკო ანალიზი, რომელსაც ასევე უწოდებენ ძირეული მიზეზის ანალიზს, ავლენს გარკვეული მოვლენების ან შედეგების მიზეზებს.
აქ მოცემულია რამდენიმე მეთოდი, რომელიც გამოიყენება სადიაგნოსტიკო ანალიზის ჩასატარებლად:
დროის სერიების ანალიზი: აანალიზებს შეგროვებულ მონაცემებს გარკვეული პერიოდის განმავლობაში. საცალო მაღაზიას შეუძლია გამოიყენოს დროის სერიების ანალიზი, რათა დადგინდეს, რომ გაყიდვები იზრდება ყოველწლიურად ოქტომბრიდან დეკემბრამდე.
კორელაციური ანალიზი: ადგენს ცვლადებს შორის ურთიერთობის სიძლიერეს. მაგალითად, ადგილობრივმა ნაყინის მაღაზიამ შეიძლება დაადგინოს, რომ რაიონში ტემპერატურის მატებასთან ერთად იზრდება ნაყინის გაყიდვებიც.
საპროგრნოზო ანალიზი / Predictive analysis: რა შეიძლება მოხდეს?
საპროგრნოზო ანალიზი მიზნად ისახავს მომავალი მოვლენების წინასწარ განსაზღვრას. წარსული მონაცემების ანალიზით კომპანიებს შეუძლიათ მომავალი სცენარების პროგნოზირება და სტრატეგიული გადაწყვეტილებების მიღება.
აქ მოცემულია რამდენიმე მეთოდი, რომლებიც გამოიყენება საპროგრნოზო ანალიზის შესასრულებლად:
მანქანური სწავლება: იყენებს AI და ალგორითმებს შედეგების პროგნოზირებისთვის. მაგალითად, საძიებო სისტემები იყენებენ მანქანურ სწავლებას, რათა ურჩიონ პროდუქტები ონლაინ მყიდველებს, რომლებსაც ისინი სავარაუდოდ იყიდიან თავიანთი დათვალიერების ისტორიიდან გამომდინარე.
გადაწყვეტილების ხეები: ასახავს მოქმედების შესაძლო კურსებს და შედეგებს. მაგალითად, ბიზნესს შეუძლია გამოიყენოს გადაწყვეტილების ხე, როდესაც გადაწყვეტს შემცირებას თუ გაფართოებას.
პრესკრიპტული ანალიზი: რა ზომები უნდა მივიღოთ?
ანალიზის უმაღლესი დონე, პრესკრიპტული ანალიზი, ის არა მხოლოდ პროგნოზირებს რა შეიძლება მოხდეს, არამედ გვთავაზობს ოპტიმალურ პასუხს ამ შედეგზე. მას შეუძლია გააანალიზოს სხვადასხვა არჩევანის პოტენციური შედეგები და რეკომენდაცია გაუწიოს მოქმედების საუკეთესო გზას
აქ მოცემულია რამდენიმე მეთოდი, რომლებიც გამოიყენება პრესკრიპტული ანალიზის შესასრულებლად:
ალგორითმები: გამოიყენება ტექნოლოგიაში კონკრეტული ამოცანების შესასრულებლად. მაგალითად, ბანკები იყენებენ ალგორითმებს კლიენტების ხარჯების მონიტორინგისთვის და ურჩევენ მათ გამორთონ საკრედიტო ბარათი, თუ თაღლითობაზე ეჭვობენ.
მონაცემთა ანალიზის პროცესი: როგორ დავიწყოთ
უშუალოდ ანალიზი მთლიანი პროცესის მხოლოდ ერთ ნაწილია, გთავაზობთ მთლიანი პროცესის აღწერას და მასში შემავალ ყველა ეტაოპს:
გადაწყვეტილების მიღება
როგორც თითქმის ნებისმიერი პროექტი, პირველი ნაბიჯი არის იმის განსაზღვრა, თუ რა პრობლემის გადაჭრას ცდილობთ მონაცემთა ანალიზის საშუალებით.
მაგალითად, კვების მიტანის სერვისს შეიძლება სურდეს გაიგოს, რატომ აუქმებენ მომხმარებლები “გამოწერის” სერვისს. მაგრამ მსგავსი მოცემულობა საკმაოდ ზოგადია და შესაბამისად გაჭირდება ეფექტური ანალიზის გაკეთება. კითხვა უნდა იყოს უფრო მიზანმიმართული, როგორიცაა “როგორ შევამციროთ მომხმარებელთა “გასვლა” ხარჯების გაზრდის გარეშე?”
ეს კითხვები დაგეხმარებათ განსაზღვროთ თქვენი KPI-ები და შესაბამისად მარტივად განსაზღვრავთ მონაცემთა ანალიზის რა ტიპ(ებ)ი გჭირდებათ, ასე რომ, დაუთმეთ დრო კითხვის დახვეწას – წინააღმდეგ შემთხვევაში თქვენი ანალიზი არ მოგცემთ თქვენთვის სასურველ ქმედით ინფორმაციას.
მონაცემების შეგროვება
შეაგროვეთ საჭირო მონაცემები როგორც შიდა, ასევე გარე წყაროებიდან.
შიდა მონაცემების წყარო არის თქვენი ბიზნესი (CRM პროგრამული უზრუნველყოფა, შიდა ანგარიშები და არქივები) მსგავსი ინფორმაცია გეხმარებათ გაანალიზოთ თქვენი ბიზნესი და პროცესები.
გარე მონაცემები აკუმლირდება კომპანიის გარეთ (გამოკითხვები, საჯარო მონაცემები) და გეხმარებათ გაანალიზოთ თქვენი ინდუსტრია და თქვენი მომხმარებლები.
მონაცემთა შეგროვებისთვის ძირითადად სხვადასხვა პროგრამული ინსტრუმენტები დაგჭირდებათ: სხვადასხვა ტიპის CRM პლატფორმები, გამოკითხვის აპლიკაციები და ა.შ.
მონაცემების გასუფთავება
მონაცემებმა შეიძლება დიდ შეცდომაში შეგიყვანოთ თუ მათ გასუფთავების გარეშე დაამუშავებთ. ასე რომ, სანამ გაანალიზებთ, დარწმუნდით, რომ თქვენს მიერ შეგროვებულ მონაცემები სუფთაა. მონაცემების ტიპის მიხედვით, გასუფთავება განსხვავებულად გამოიყურება, მაგრამ ის შეიძლება შეიცავდეს:
- არასაჭირო ინფორმაციის წაშლას
- სტრუქტურული შეცდომების მოგვარებას, როგორიცაა მართლწერის შეცდომა
- დუბლიკატების წაშლა
- ცარიელი ჩანაწერების ამოღება
მონაცემების ანალიზი
ახლა, როდესაც თქვენ შეგროვეთ და გაასუფთავეთ მონაცემები, გამოიყენეთ მონაცემთა ანალიზის ერთი ან მეტი ტიპი, რათა იპოვოთ ერთიერთკავშირები, ტენდენციები და ა.შ.
მონაცემთა ანალიზის ინსტრუმენტებს შეუძლიათ დააჩქარონ მონაცემთა ანალიზის პროცესი:
Spreadsheets: მონაცემთა დახარისხება, ფილტრაცია, ანალიზი და ვიზუალიზაცია.
Business intelligence პლატფორმები: მონაცემების მოდელირება და დეშბორდების შექმნა.
Structured query language (SQL) ხელსაწყოები: მართეთ და ამოიღეთ მონაცემები რელაციურ მონაცემთა ბაზებში.
და პროცესის ბოლო ეტაპი – მონაცემთა ინტერპრეტაცია და ვიზუალიზაცია
მონაცემების გაანალიზების შემდეგ, თქვენ უნდა დაუბრუნდეთ თქვენს მიერ დასმულ საწყის კითხვას და გამოიტანოთ შესაბამისი დასკვნები თუმცა გაითვალისწინეთ რამოდენიმე ფაქტორი – მხოლოდ იმიტომ, რომ ორი ცვლადი ერთმანეთთან ასოცირდება, არ ნიშნავს რომ ისინი აუცილებლად არიან დაკავშირებული ან ერთმანეთზე დამოკიდებულნი.
მეორე ყველაზე გავრცელებული შეცდომა ინტერპრეტაციის დროს არის დადასტურების მიკერძოება: ეს ხდება მაშინ, როდესაც თქვენ ინტერპრეტაციას აკეთებთ მონაცემებს ისე, რომ ადასტურებთ თქვენს წინასწარ გააზრებულ შეხედულებებს. ამის თავიდან ასაცილებლად, სთხოვეთ რამდენიმე ადამიანს მონაცემების ინტერპრეტაცია.
და ბოლოს – მონაცემების მცირე რაოდენობა: თუ თქვენი მონაცემების ზომა ძალიან მცირეა შეიძლება მიიღოთ არასწორი შედეგები. თუ ამას წააწყდებით, განიხილეთ თქვენი მონაცემების ზომის გაფართოება, რათა უფრო ზუსტი წარმოდგენა მოგცეთ.
რაც შეეხება მონაცემთა ვიზუალიზაციას – მონაცემთა ვიზუალიზაცია გრაფიკების, რუქების, მოხსენებების, სქემების და დეშბორდების სახით დაგეხმარებათ აუხსნათ თქვენი დასკვნები გადაწყვეტილების მიმღებებსა და დაინტერესებულ მხარეებს. ეს გეხმარებათ თქვენი მონაცემები და დასკვნები ბიზნესისთვის მარტივ ენაზე გადმოცეთ.
და ბოლოს – გახსოვდეთ რომ მონაცემები ერთ ადგილას არ არის თავმოყრილი, იმისათვის რომ გაამარტივოთ მონაცემების შეგროვება და ანალიზი სასურველია თქვენმა ყველა აპლიკაციამ ერთმანეთში გაცვალოს ინფორმაცია.