LLM

Mikä on LLM eli suuri kielimalli?

LLM (Large Language Model) tarkoittaa suurta kielimallia, joka on opetettu valtavalla määrällä tekstidataa. Kyseessä on generatiivisen tekoälyn muoto, joka osaa tuottaa luontevaa tekstiä luonnollisella kielellä annetun syötteen perusteella. LLM osaa esimerkiksi vastata kysymyksiin, selittää käsitteitä, kirjoittaa tekstejä tai keskustella sujuvasti. 

LLM-mallit ovat tämän hetken tekoälyn "supermalleja". Niissä yhdistyy poikkeuksellisen suuri määrä parametreja (eli mallin sisäisiä säätöjä) ja opetusdataa. Malli on kuin massiivinen kielitaju, joka on syntynyt lukemalla kaiken mahdollisen, mitä sen kouluttajat ovat siihen voineet syöttää: kirjoja, artikkeleita, verkkokeskusteluja, dokumentaatioita ja muuta julkista sisältöä.

Mikä erottaa LLM-mallit muista?

Suurin ero LLM-mallien ja kevyempien kielimallien välillä on skaalassa:

LLM-mallit voivat myös mukautua uusiin käyttötarkoituksiin esimerkiksi hienosäädön (fine-tuning) tai lisätiedon avulla. Näin samaa mallia voidaan hyödyntää eri toimialoilla – esimerkiksi asiakaspalvelussa, sisällöntuotannossa tai ohjelmistokehityksessä.

Mistä LLM saa tietonsa?

Yksi kielimallien tärkeimmistä erottautumistekijöistä on opetusdatan laatu ja monipuolisuus. Eri mallien taustalla on erilaisia lähteitä:

Erityisen kiinnostavia ovat esimerkiksi keskustelualustat ja kysymys–vastaus-tyyppiset tietolähteet, koska ne tarjoavat aitoa, arkista kielenkäyttöä ja usein myös ratkaisukeskeistä sisältöä. Tällainen data auttaa mallia oppimaan, miten ihmiset oikeasti esittävät kysymyksiä ja miten niihin vastataan ymmärrettävästi.