Suuri kielimalli
Suuri kielimalli (engl. Large language Model, LLM) on koneoppimisen malli, jota käytetään kielen käsittelyyn ja erityisesti generoidun tekstin luomiseen. Se on pitkälle kehitetty neuroverkkopohjainen kielimalli, joka on koulutettu käsittelemään huomattavan suuria määriä dataa.[1] Suuri kielimalli on mahdollistanut luovien keskustelubottien kehityksen. Kehittyneimmät suuret kielimallit ovat GPT-kielimalleja, joita käytetään esimerkiksi ChatGPT tai Gemini -keskusteluboteissa.
Suuret kielimallit toimivat kielimallin tavoin eli ne kykenevät jatkamaan ja luomaan tekstiä annetun syötteen perusteella. Toiminta pohjautuu transformer-arkkitehtuuriin. Arkkitehtuurissa sanat jaetaan tokeneiksi kielimallin käsittelyä varten. Suuria kielimalleja esikoulutetaan antamalla suuret määrät tekstiä korpuksen muodossa.[2] Tämän jälkeen kielimallin suorituskykyä on paranneltu hienosäädön avulla, jolloin sitä voidaan käyttää paremmin erityisten alojen tehtäviin.[3]
Lähteet
[muokkaa | muokkaa wikitekstiä]- ↑ Artikkeli: Mitkä ihmeen suuret kielimallit? delingua.fi. 13.3.2024. Viitattu 1.6.2025.
- ↑ Numminen, Lari: Mitä ovat suuret kielimallit ja miten ne toimivat? Finnishup. 17.10.2023. Finnishup. Viitattu 1.6.2025.
- ↑ Mikä on suuri kielimalli (LLM)? | SAP www.sap.com. Viitattu 1.6.2025.