Top P

Top P – kuinka monta tietä on risteyksessä?

Kuvitellaan hetki, että generatiivinen kielimalli on kulkemassa tietä ja jokaisen sanan tai tokenin kohdalla se saapuu risteykseen, jossa sen on valittava seuraava askel eli seuraava sana.

Tässä tilanteessa:


Mitä Top P tekee?

Jokaisessa risteyksessä malli näkee monia mahdollisia polkuja, eli sanoja, joita se voisi sanoa seuraavaksi. Jokaisella vaihtoehdolla on todennäköisyysarvo, eli kuinka todennäköisesti se sopisi tähän tilanteeseen.

Top P toimii suodattimena:

Eli: Top P = 0.9 tarkoittaa, että risteyksessä näkyy vain ne tiet, jotka muodostavat 90 % todennäköisyysmassasta. Harvinaiset reitit eivät ole lainkaan näkyvissä.


Entä temperature?

Kun Top P on rajannut näkyvät vaihtoehdot, temperature määrittää, minkä polun malli valitsee:

Temperature ei vaikuta siihen, mitä vaihtoehtoja on näkyvissä – ainoastaan siihen, miten niistä valitaan.


Esimerkki

Kysymys: "Mitä voisi syödä aamiaiseksi?"


Yhteenveto

Risteysanalogian mukaan:

Yhdessä nämä kaksi ohjaavat mallin luovuutta, varmuutta ja tyyliä – ja niitä säätämällä voit vaikuttaa siihen, miltä vastaukset tuntuvat: varmoilta, kokeilevilta, rohkeilta tai jopa yllättäviltä.