Siirry sisältöön

Suuri kielimalli

Wikipediasta

Suuri kielimalli (engl. Large language Model, LLM) on koneoppimisen malli, jota käytetään kielen käsittelyyn ja erityisesti generoidun tekstin luomiseen. Se on pitkälle kehitetty neuroverkkopohjainen kielimalli, joka on koulutettu käsittelemään huomattavan suuria määriä dataa.[1] Suuri kielimalli on mahdollistanut luovien keskustelubottien kehityksen. Kehittyneimmät suuret kielimallit ovat GPT-kielimalleja, joita käytetään esimerkiksi ChatGPT tai Gemini -keskusteluboteissa.

Suuret kielimallit toimivat kielimallin tavoin eli ne kykenevät jatkamaan ja luomaan tekstiä annetun syötteen perusteella. Toiminta pohjautuu transformer-arkkitehtuuriin. Arkkitehtuurissa sanat jaetaan tokeneiksi kielimallin käsittelyä varten. Suuria kielimalleja esikoulutetaan antamalla suuret määrät tekstiä korpuksen muodossa.[2] Tämän jälkeen kielimallin suorituskykyä on paranneltu hienosäädön avulla, jolloin sitä voidaan käyttää paremmin erityisten alojen tehtäviin.[3]

  1. Artikkeli: Mitkä ihmeen suuret kielimallit? delingua.fi. 13.3.2024. Viitattu 1.6.2025.
  2. Numminen, Lari: Mitä ovat suuret kielimallit ja miten ne toimivat? Finnishup. 17.10.2023. Finnishup. Viitattu 1.6.2025.
  3. Mikä on suuri kielimalli (LLM)? | SAP www.sap.com. Viitattu 1.6.2025.