Supervised learning
Mikä on supervised learning?
Supervised learning eli valvottu oppiminen on yksi yleisimmistä tavoista opettaa koneoppimismalleja – mukaan lukien generatiivisia tekoälymalleja. Tässä menetelmässä mallia opetetaan käyttämällä valmiita esimerkkejä, joissa on sekä syöte että siihen kuuluva oikea vastaus.
Toisin sanoen: mallille näytetään, miten sen pitäisi vastata tietynlaiseen syötteeseen – ja se oppii matkimalla näitä esimerkkejä.
Miten supervised learning toimii?
-
Ihmiset tai järjestelmät kokoavat mallidataa, jossa jokaiselle syötteelle on liitetty oikea vastaus.
-
Malli "katsoo" esimerkin ja oppii vähitellen tuottamaan vastaavia vastauksia uusissa tilanteissa.
-
Mallin tekemä ennuste verrataan todelliseen oikeaan vastaukseen, ja virhe lasketaan.
-
Virheen perusteella mallin sisäisiä painoja säädetään, jotta seuraavalla kerralla vastaus olisi tarkempi.
Esimerkki
Opetusesimerkki voisi näyttää tältä:
-
Syöte: "Kuka oli Suomen presidentti vuonna 2000?"
-
Oikea vastaus: "Tarja Halonen"
Jos malli vastaa väärin, esimerkiksi "Martti Ahtisaari", virhe havaitaan ja mallia korjataan oppimaan parempi vastaus seuraavalla kierroksella.
Miksi supervised learning on tärkeä?
-
Se on erittäin tehokas ja hallittu tapa opettaa mallille toivottua käytöstä.
-
Se mahdollistaa tarkan seurannan siitä, miten hyvin malli on oppinut.
-
Se soveltuu erityisesti tehtäviin, joissa on selkeät oikeat vastaukset, kuten asiakaspalvelu, kysymys–vastaus-järjestelmät tai luokittelu.
Rajoituksia
-
Datan laatu ratkaisee: Jos opetusesimerkit ovat virheellisiä, malli oppii väärin.
-
Vaatii paljon ihmistyötä, sillä oikeiden vastausten liittäminen esimerkkeihin on usein manuaalista.
-
Ei toimi hyvin luovissa tai monitulkintaisissa tehtävissä, joissa ei ole vain yhtä oikeaa vastausta.
Yhteenveto
Supervised learning on peruskivi mallin kouluttamisessa, erityisesti silloin, kun halutaan opettaa mallille selkeitä sääntöjä tai käyttäytymistä. Se on myös yksi vaihe, jonka päälle voidaan rakentaa muita opetusmenetelmiä, kuten fine tuning tai reinforcement learning.