RAG

Mikä on RAG?

RAG (Retrieval-Augmented Generation) on menetelmä, jolla generatiiviselle tekoälylle voidaan antaa täydentävää tietoa vastauksia varten. Sen avulla mallin vastauksia voidaan päivittää reaaliaikaisesti ilman uudelleenkoulutusta.

Miten RAG toimii?

  1. Täydentävä tieto – kuten organisaation sisäiset ohjeet, dokumentaatio tai ajankohtaiset uutiset – tallennetaan erilliseen tietovarastoon, joka usein toimii niin kutsuttuna vektorikantana.

  2. Kun käyttäjä esittää kysymyksen, järjestelmä hakee tietovarastosta tekstipätkät, jotka ovat mahdollisimman lähellä kysymyksen aihetta.

  3. Nämä haetut tekstipalat annetaan mallille yhdessä kysymyksen kanssa, jolloin malli muodostaa vastauksensa koulutuksensa sekä tuoreen, tilanteeseen liittyvän tiedon avulla.

Mitä hyötyä RAGista on?

Esimerkki:

Yritys voi hyödyntää RAGia niin, että chatbot vastaa asiakaspalvelukysymyksiin yrityksen omien ohjeistuksien ja tietokantojen pohjalta vaikka pohjana oleva kielimalli ei olisi koskaan niitä "lukenut" koulutuksessa.

Mitä haasteita RAGiin liittyy?

Vaikka RAG tarjoaa tehokkaan keinon täydentää mallin osaamista, siihen liittyy myös rajoituksia:

RAG toimii parhaiten, kun:

RAG ei tee mallista kaikkitietävää, mutta se tuo sen lähemmäs ajankohtaista ja kontekstiin sidottua ymmärrystä.