Izpēte - ML pamati

Atjaunots: 2024-11-05

Saturs

Mašīnmācīšanās (machine learning, ML) tehnoloģija, ko izmanto, lai apmācītu mašīnas veikt dažādas darbības, piemēram, prognozes, ieteikumus, klasificēšanu utt., pamatojoties uz vēsturiskiem datiem vai pagātnes pieredzi. Mašīnmācīšanās ļauj datoriem rīkoties kā cilvēkiem, apmācot tos, izmantojot pagātnes pieredzi un prognozētos datus.

Mašīnmācīšanās atšķiras no tradicionālās programmēšanas, izmantojot milzīgu apmācības datu apjomu, lai izprastu datu pamatā esošos modeļus — šo procesu sauc par "mācīšanos". Pēc apmācības mašīnmācības modelis var izdarīt secinājumus un prognozes par jauniem, iepriekš neredzētiem datiem. Jo vairāk apmācības datu būs pieejami mašīnmācīšanās modelim, jo precīzākas būs šīs prognozes.

Dažas vietas, kur šobrīd izmanto mašīnmācīšanās modeļus:

Meklēšana tīmeklī: meklēšanas rezultātu lapas izkārtojums, prognozējot, uz kā lietotājs, visticamāk, noklikšķinās;
Finanses: prognozēt, kam un kad nosūtīt kredītkartes piedāvājumu;
E-komercija: prongozēt, klientu skaita samazināšanos;
Robotika: kā tikt galā ar nenoteiktību jaunā vidē;
Sociālie tīkli: prognozēt, kam un kad parādīt reklāmu, balstoties uz lietotāja vēlmēm un paradumiem;
Atkļūdošana: ieteikt, kur varētu būt kļūda;
Medicīna: pamanīt vēža šūnas medicīnas attēlos;
Marketings: veikt A/B testus, lai noteiktu efektīvāko tekstu-attēlu kombinācijas.

Kādi ir mašinmācīšanās veidi?

Pārraudzīta mācīšanās

Pārraudzītas mācīšanās (supervised learning) laikā algoritmu apmāca ar marķētiem piemēriem. Pārraudzīta mācīšanās ir piemērojama, ja algoritmam ir datu paraugi, t.i., ievades un izvaddati ar pareiziem marķējumiem (labels). Pārraudzīta mācību tehnika palīdz paredzēt nākotnes notikumus, izmantojot pagātnes pieredzi un marķētus piemērus. Sākotnēji algoritmi analizē zināmo apmācības datu kopu, un vēlāk piedāvāsavas prognozes par izvades vērtībām. Turklāt tas arī prognozē kļūdas visā mācību procesā un arī labo šīs kļūdas, izmantojot algoritmus.

Divi no visbiežāk uzraudzītās mašīnmācīšanās uzdevumiem ir klasifikācija un regresija.

Klasifikācijas problēmās algoritmam ir jāiemācās paredzēt noteiktas vērtības. Tas nozīmē, ka algoritmam ir jāparedz visiespējamākā kategorija, klase vai marķējums jauniem piemēriem. Klasifikācijas pielietojumi ietver prognozēšanu, vai akciju cena pieaugs vai kritīsies, vai izlemšanu, vai ziņu raksts pieder politikas vai atpūtas sadaļai.

Regresijas problēmās iekārtai jāparedz nepārtrauktas reakcijas mainīgā vērtība. Regresijas problēmu piemēri ietver jauna produkta pārdošanas apjomu vai darba algas prognozēšanu, pamatojoties uz tā aprakstu.

Piemērs: pieņemsim, ka mums ir attēlu kopa, kas atzīmēta kā "lietussargs". Ar šiem lietussargu attēliem ir apmācīts mašīnmācīšanās algoritms, lai tas varētu viegli atšķirt, vai attēls ir lietussargs vai nē.

Nepārraudzīta mācīšanās

Nepārraudzīta mācīšanā (unsupervised learning) notiek, ja ir neklasificēti un neapzīmēti dati, kur sistēma mēģina no datiem atklāt modeļus Apmācības informācija nav ne klasificēta, ne marķēta; līdz ar to mašīna ne vienmēr var nodrošināt pareizu rezultātu salīdzinājumā ar uzraudzīto mācīšanos.

Lai gan praktiskos uzņēmējdarbības iestatījumos nepārraudzīta mācīšanās ir retāk sastopama, tā palīdz izpētīt datus un var izdarīt secinājumus no datu kopām, lai aprakstītu slēptās struktūras no nemarķētiem datiem.

Viens no izplatītākajiem uzdevumiem ir grupēt līdzīgus piemērus, ko sauc par klasterizāciju. Piemērs. Pieņemsim, ka sistēma ir apmācīta ar noteiktu dokumentu kopu ar dažādām kategorijām (A, B un C tips), un mums tie ir jāsakārto atbilstošās grupās. Tā kā sistēma tiek nodrošināta tikai ar ievades paraugiem vai bez izvades, tā var sakārtot šīs datu kopas A, B un C tipa kategorijās, taču nav teikts, ka tas ir pareizi sakārtots vai nē.

Pastiprināšanas mācīšanās

Pastiprināšanas mācīšanās (reinforcement learning) ir uz atgriezenisko saiti balstīta mašīnmācīšanās tehnika. Šāda veida mācībās aģentiem (datorprogrammām) ir jāizpēta vide, jāveic darbības, un, pamatojoties uz viņu darbībām, viņi saņem atlīdzību kā atgriezenisko saiti. Par katru labu darbību viņi saņem pozitīvu atlīdzību, un par katru sliktu darbību viņi saņem negatīvu atlīdzību. Pastiprināšanas mācību aģenta mērķis ir maksimāli palielināt pozitīvo atlīdzību, piemēram, palieliniet spēlē izcīnīto punktu skaitu. Tā kā nav marķētu datu, aģentam ir pienākums mācīties no savas pieredzes.

Aktivitāte Nr.1 - Video

Noskaties video:

Uzraksti atbildes uz šādiem jautājumiem:

saviem vārdiem izskaidro, kas ir mašīnmācīšanās?
kas ir nepieciešams, lai 'apmācītu' ML modeli?
kādās programmās (pakalpojumos) jau tiek izmantota mašīnmācīšanās?
kādos gadījumos varētu izmantot mašīnmācīšanās algoritmus nevis cilvēku prasmes?
kādos gadījumos varētu izmanto cilvēku prasmes nevis mašīnmācīšanās algoritmus?

Aktivitāte Nr.2 - Video

Noskaties video:

Nosaki, vai tiek izmantota pārraudzīta vai nepārraudzīta mācīšanās:

YouTube video rekomendācija;
Epastu vēstuļu atzīmēšanā, kā spam;
Automašīnas numura noteikšana fotoradarā;

Aktivitāte Nr.3 - Modeļa trenēšana

Izmanto teachablemachine.withgoogle.com, lai uztrenētu pats savu ML modeli atpazīt spēli akmens, šķeres, papīrs.

Izveido ekrānšāviņu, kad modelis atpazīst:

akmeni;
šķeres;
papīru.

Darbu iesniegšana

Aizpildi darba lapu un atsūti eklasē;

Programmēšana II SR

Aktivitāte vērsta uz šādām Programmēšana II sasniedzamajiem rezultātiem (SR):

Zināšanas: Skaidro mašīnmācīšanās darbības pamatprincipus.

Autors

Mārtiņš Bērziņš

Uzraksti atsauksmi uz [email protected] [email protected]