Siirry sisältöön

Ohje:Tekoälyn käyttö

Wikipediasta
(Ohjattu sivulta Ohje:Kielimallit)

Tämä artikkeli käsittelee tekoälyohjelmien käyttöä mm. kuva- ja tekstituotannossa. Suomenkielisen Wikipedian sisäisessä kielenkäytössä kielimalline (muodollisemmin kielisymbolimalline) tarkoittaa lähdeviitteessä olevaa parametria, joka osoittaa käytetyn kielen esimerkiksi (saksaksi) ja (baskiksi).

»Kielimallit ovat luotettavuudeltaan, ymmärtämiseltään ja aihealueiltaan rajallisia, minkä vuoksi ne tarvitsevat ihmisvalvontaa.»
(Michael Osborne, koneoppimisen professori Oxfordin yliopiston insinööritieteiden laitoksella, 25.1.2023[1])

Kielimallit ovat luonnollisen kielen käsittelyyn tarkoitettuja, usein keinotekoisiin neuroverkkoihin perustuvia tietokoneohjelmia, joita käytetään tekstin tuottamiseen, muokkaamiseen ja analysointiin. Kielimallit mahdollistavat monenlaisia sovelluksia, kuten tekoälychatbotit ja tekoälyhakukoneet. Niitä käytetään yhä useampiin ominaisuuksiin yleisissä sovelluksissa, kuten tekstinkäsittelyohjelmissa ja taulukkolaskentaohjelmissa. Tässä ohjeessa termeillä ”kielimalli” ja ”kielimallituotos” viitataan tällaisiin järjestelmiin, niitä hyödyntäviin sovelluksiin sekä niiden tuottamaan sisältöön. Tekoäly on laajempi yläkäsite, joka kattaa kaikki älyllisiä tehtäviä suorittavat automaattiset järjestelmät. Näihin kuuluvat kielimallien lisäksi esimerkiksi kuvien, äänen ja muun multimediasisällön tuottamiseen tarkoitetut työkalut. Yleisempää termiä ”tekoäly” käytetään kohdissa, joiden periaatteet ulottuvat kaikkiin tekoälyn muotoihin. Tämä ohje keskittyy ensisijaisesti kielimallien käyttöön tekstintuotannossa. Ohjeen määrittelemät vastuut ja periaatteet koskevat kuitenkin soveltuvin osin kaikkia tekoälyn muotoja riippumatta sovelluksen nimestä, tekijästä tai teknisestä toteutustavasta. Tekoälyn tuottamaa multimediasisältöä käsitellään tarkemmin erillisessä osiossa.

Kielimallit ovat oikein käytettynä hyödyllisiä apuvälineitä, mutta muokkaajien on oltava myös perillä niihin liittyvistä rajoituksista. Kielimalleilla tuotettu sisältö voi usein olla suoranaista sepitystä, johon liittyy täysin keksittyjä lähdeviittauksia. Sen tuottamaa tekstiä ei ole tarkistettu, ja teksti on verrattavissa uuteen tutkimukseen. Se voi olla myös puolueellista, herjata eläviä ihmisiä ja rikkoa tekijänoikeuksia. Siksi on välttämätöntä, että muokkaajat tarkistavat kielimallien tuottaman tekstin niistä riippumattomista lähteistä ennen tekstin lisäämistä Wikipedian artikkeleihin. Kielimallivälineitä ei saa käyttää omissa muokkauksissa, ellei muokkaaja itse ole täysin tietoinen näistä riskeistä. Kielimalleja ei saa käyttää tehtäviin, joihin muokkaajalla ei ole riittävää aihepiirin tai lähdemateriaalin perehtyneisyyttä, jotta hän kykenisi tarkistamaan ja korjaamaan tuotoksen. Tarkista niiden tuotokset huolellisesti ja varmista, että ne noudattavat kaikkia käytäntöjä. Muokkaaja on täysin vastuussa kaikista muokkauksistaan eli myös niistä, jotka on tehty kielimallien avulla.

  1. Älä lisää Wikipediaan kielimallin tuottamia uusia väitteitä, tulkintoja tai viitteitä. Kielimallin tuottamaa tekstiä ei saa käyttää uutena tietona tai lähteenä. Muotoiluapu (kielenhuolto, tiivistys, uudelleenkirjoitus, rakenteen selkeytys) on sallittua vain jo lähteistetystä sisällöstä. Muokkaajan on varmistettava, että merkitys säilyy eikä uutta tietoa synny.
  2. Kielimallit ovat apuohjelmia, jotka antavat neuvoja kirjoittamiseen. Ne voivat esittää vaihtoehtoisia sanoja, muokata kappaleita tai tarkistaa tekstin tasoa. Kielimallien neuvot eivät ole aina totta tai luotettavia. Sinun pitää itse arvioida ja valita, noudatatko niitä vai et.
  3. Voit käyttää niitä tekstin korjaamiseen, tiivistämiseen ja uudelleen muotoilemiseen, mutta huomaa, että ne eivät välttämättä havaitse kielioppivirheitä oikein tai säilytä oleellista tietoa. Ole huolellinen ja muokkaa vastausta riittävästi. Voit myös pyytää kielimallia korjaamaan puutteitaan, kuten puuttuvaa tietoa yhteenvedossa tai epäensyklopedistista, esimerkiksi mainosmaista sävyä.
  4. Sinun tulee varmistaa, että kielimallien käyttö ei aiheuta häiriötä Wikipediassa.
  5. Kielimallien luomat teokset eivät ole luotettavia lähteitä. Älä hyödynnä lähteitä, jotka eivät ole luotettavia ja tarkastettuja. Varmista, että artikkeleissa esiintyy ainoastaan totuudenmukaisia tietoja.
  6. Muokkausyhteenvedossa on ilmoitettava merkittävästä kielimallin käytöstä standardimuodossa: ”Muotoiltu tekoälyavusteisesti: [työkalu/versio]; käyttö: [kielenhuolto/tiivistys/uudelleenkirjoitus/kooste]; tarkistettu: [kyllä]”. Merkittävä käyttö: (a) kokonainen kappale/virkkeet sisällössä, (b) ehdotti väitettä/lähdettä, (c) muuttaa rakennetta.[a]
  7. Ilmoita myös muokkausyhteenvedossa selkeästi, jos käytät kielimalleja kommenttisi tuottamisessa.
  8. Wikipedia ei ole kielimallien koelaboratorio. Tämä tarkoittaa, että tekoälyn suorituskyvyn testaaminen, eri mallien vertailu tai raakatekstin massaluonti on kiellettyä kaikilla sivuilla. Käyttäjätilan alisivuja saa käyttää vain sellaiseen luonnosteluun, jonka tavoitteena on välitön sisällön parantaminen ja julkaisu artikkeliavaruuteen.

Tekoälymuokkauksen tarkistuslista

[muokkaa | muokkaa wikitekstiä]

☐ Jokainen fakta on tarkistettu alkuperäislähteestä.
☐ Jokainen lähde on olemassa ja luettu riittävästi.
☐ Muokkausyhteenveto on täytetty standardimuodossa (katso Ilmoittaminen muokkausyhteenvedossa).
☐ Merkitys ei muuttunut (uudelleenkirjoitus/tiivistys) / muutokselle on lähde.
☐ Voisin puolustaa väitteitä ilman tekoälyä (ymmärrän aiheen riittävästi).

Epävarma? Toimi näin:

  1. Testaa: ”Voinko kirjoittaa saman sisällön itse lähteiden perusteella?” Jos et, älä käytä tekoälyä.
  2. Arvioi: Arvioi, pitääkö sinun ilmoittaa tekoälyn käytöstä muokkausyhteenvedossa (katso Ilmoittaminen muokkausyhteenvedossa). Jos kyllä, ilmoittaminen on pakollista.
  3. Tarkista: Ovatko kaikki väitteet lähteissä? Jos ei, poista tai lisää lähde?-merkintä.
  4. Kysy: Edelleen epävarma? Ilmoita varmuuden vuoksi ja avaa keskustelu artikkelin keskustelusivulla tai Tekoälyvalvomon ilmoitustaululla.

MUISTA: Vilpitön virhe ≠ rikkomus.
Ongelma on toistuva välinpitämättömyys, ei yksittäinen epävarma tapaus.

Riskit ja asiaan liittyvät käytännöt

[muokkaa | muokkaa wikitekstiä]

Tekijänoikeusrikkomukset

[muokkaa | muokkaa wikitekstiä]
Asiaan liittyvä käytäntö: Wikipedia:Tekijänoikeudet.
Vihje: Kaiken Wikipediaan lisättävän tekstin tulee olla saatavilla CC BY-SA -lisenssin ehdoilla. Tämä koskee myös tekstiä, jonka olet löytänyt muualta tai kirjoittanut yhdessä muiden (mukaan lukien kielimallien) kanssa.

Kielimalli voi tuottaa tekijänoikeuksia loukkaavaa materiaalia.[b] Tuotettuun tekstiin voi sisältyä sanatarkkaa ei-vapaata sisältöä, tai se voi olla johdannaisteos eli perustua tekijänoikeuksin suojattuun materiaaliin. Lisäksi kielimallien käyttäminen tekijänoikeudella suojatun sisällön (kuten uutisartikkelit) tiivistämiseen voi johtaa tekstiin, jossa alkuperäistä materiaalia on vain vähän uudelleenmuotoiltu. Vuonna 2023 ovat myös edelleen avoinna ne kysymykset, jotka koskevat kielimallien kouluttamista tekijänoikeudella suojatulla materiaalilla[c]. Esimerkiksi kysymykseen siitä, onko kielimalleilla tuotettu sisältö tekijänoikeuksien alaista vai ei, suhtaudutaan eri maissa eri tavoilla[2]. Niiden tuotokset eivät siis välttämättä ole yhteensopivia Wikipediassa käytettävien CC BY-SA -lisenssin ja GNU (GFDL) -lisenssin kanssa.

Uuden tutkimuksen välttäminen ja ”hallusinaatiot”

[muokkaa | muokkaa wikitekstiä]
Asiaan liittyvä käytäntö: Wikipedia:Ei uutta tutkimusta.
Vinkki: Wikipedia-artikkeleihin ei saa tehdä uutta tutkimustietoa. Tämä tarkoittaa uusien tosiseikkojen, väitteiden ja ideoiden esittämistä tai julkaistun materiaalin analysointia tai yhdistelyä siten, että se johtaa lähteissä esittämättömiin päätelmiin. Kaiken tiedon tulee perustua luotettaviin, julkaistuihin lähteisiin, jotka tukevat esitettyjä väitteitä ja liittyvät suoraan aiheeseen.

Vaikka kielimallit saattavat antaa tarkkoja vastauksia joihinkin kysymyksiin, ne saattavat myös tuottaa vinoutuneita tai virheellisiä vastauksia, joskus hienovaraisesti, joskus vähemmän hienovaraisesti. Esimerkiksi jos pyydetään kirjoittamaan artikkeli lasinsirujen syönnin eduista, kielimalli saattaa joskus tehdä niin. Tämä voi olla vaarallista, siksi kielimalleja Wikipedia-sisällön kirjoittamisessa apunaan käyttävien muokkaajien tulee olla erityisen tarkkoina, jotta tällaisten kielimallien tuottaman uuden tutkimuksen lisääminen tietosanakirjaan vältettäisiin.

Kielimallit ovat kaavan täydentämisen ohjelmia: ne tuottavat tekstiä valitsemalla todennäköisimmät sanat edellisten perään. Ne oppivat nämä kaavat koulutusaineistostaan, joka sisältää monenlaista sisältöä internetistä ja muualta, kuten kaunokirjallisuutta, salaliittoteorioita, propagandaa jne. Sen vuoksi kielimallit voivat sepittää asioita, joita pidetään myös uutena tutkimuksena ja hallusinaatioina. Huomaa, että kielimallin koulutusaineisto sisältää ainoastaan digitaalisessa muodossa olevaa aineistoa[3]. Esimerkiksi arkistomateriaalia, käsialakirjoituksia tai luentoja ei ole mukana, ellei niitä ole ensin digitoitu ja sisällytetty mallin koulutusaineistoon. Kielimalli ei myöskään pysty arvioimaan koulutusaineistonsa lähteiden aitoutta tai ajantasaisuutta, joten mallin tuottama sisältö voi sisältää virheitä tai epätarkkuuksia. Tämän seurauksena kielimallien tietopohja on epätasainen: ne voivat hallita jotkin aihealueet erittäin kattavasti mutta olla lähes tietämättömiä toisista. Tätä voidaan kuvata ”reikäjuustomaisena” osaamisena, jossa aukot voivat olla yllättäviä ja vaikeasti havaittavia. Siksi mallien tuotoksia ei pidä arvioida pelkän sujuvuuden tai vakuuttavuuden perusteella.

Käytettäessä kielimallia harvinaisiin aiheisiin, monimutkaisiin kysymyksiin tai tehtäviin, joihin ne eivät sovellu (eli tehtäviin, jotka vaativat laajaa tietämystä tai analyysiä), virheiden esiintyminen on paljon todennäköisempää. Koska kielimallit vastaavat itsevarmasti, niiden virheet vaikuttavat helposti hyväksyttäviltä tosiasioilta ja uskottavilta mielipiteiltä. Esimerkiksi kun yhdysvaltalainen teknologialehti Fast Company testasi ChatGPT:tä ja pyysi sitä luomaan neljänneskatsauksen Teslan viimeisimmästä talouskehityksestä, kaikki tuotetut tiedot olivat täysin virheellisiä[4].

Vastaavasti kun kielimallia pyydetään vahvistamaan kuvitteellisen eläinlajin, kuten ”isohammassaukon” (Lutra maxidens), olemassaolo suomalaisilla luonnonsuojelualueilla, se saattaa tuottaa itsevarman vastauksen:

”Kyllä, isohammassaukkoja tavataan harvinaisina luonnonsuojelualueilla Lapissa. Ne ovat yöaktiivisia ja ujoja, joten niitä on vaikea havaita päivällä, mutta jälkiä voi löytää jokivarsista.”

Esimerkin laji on täysin keksitty, mutta malli yhdistää tietoa aidosta saukosta (Lutra lutra) ja esittää sen faktana. Tämä korostaa, että kielimallien tuotoksia ei saa hyväksyä sellaisenaan, vaan ne on aina tarkistettava riippumattomista luotettavista lähteistä.

Lähdesilmukat ja niiden riskit

[muokkaa | muokkaa wikitekstiä]

Kielimallien käytössä on myös riski ajautumisesta tietynlaiseen lähdesilmukkaan.Tämä johtuu siitä, että kielimallien itsensä yhtenä koulutusaineistona muun datan ohella ovat usein erikieliset Wikipediat itsessään. Koska kielimallit itse käyttävät lähteenä Wikipediaa, niin tämän takia niiden tuottama aineisto on ainakin osittain myös Wikipediasta peräisin. Tässä tilanteessa ajaudutaan ei-toivottuun lähdesilmukkaan, jossa Wikipediaa itsessään käytetään lähteenä artikkelien kirjoittamiselle. Lisäksi tulevaisuuden kielimallit ja niiden uudet versiot saatetaan kouluttaa osittain Wikipedia-aineistolla, jota on muokattu kielimallien tuottaman sisällön perusteella. Tämä luo syvemmän lähdesilmukan, jossa kielimalleilla muokataan Wikipediaa ja Wikipediaa käytetään kielimallien koulutusaineistona. Tämä lähdesilmukka voi voimistaa olemassa olevia vinoumia tai virheitä ja tehdä niiden korjaamisesta vaikeampaa[d].

Lähteetön tai tarkistamaton sisältö

[muokkaa | muokkaa wikitekstiä]
Asiaan liittyvä käytäntö: Wikipedia:Tarkistettavuus.
Vinkki: Lukijoiden tulee voida tarkistaa, että Wikipedian artikkeleissa oleva tieto ei ole pelkkää sepitettä. Se tarkoittaa, että kaiken materiaalin on oltava jäljitettävissä luotettaviin, julkaistuihin lähteisiin. Lisäksi lainaukset ja kaikki materiaali, joka on kyseenalaistettavissa, on tuettava tekstissä olevilla viittauksilla.

Kielimallit eivät noudata Wikipedian käytäntöjä tarkistettavuudesta ja luotettavista lähteistä. Kielimallit jättävät joskus viittaukset kokonaan pois tai viittaavat lähteisiin, jotka eivät täytä Wikipedian luotettavuusstandardeja (mukaan lukien Wikipediaan viittaaminen lähteenä). Joissakin tapauksissa ne jopa hallusinoivat olemattomia viitteitä sepittämällä otsikoita, tekijöitä ja URL-osoitteita.

Kielimalleilla hallusinoitu sisältö, kuten edellä selitettiin, rikkoo myös tarkistettavuuden käytäntöä, koska sitä ei voida todentaa, koska se on sepitettyä: viitteitä ei ole löydettävissä.

Algoritminen vinouma ja puolueellinen näkökulma

[muokkaa | muokkaa wikitekstiä]
Asiaan liittyvä käytäntö: Wikipedia:Neutraali näkökulma.
Vinkki: Artikkeleiden ei tule ottaa kantaa, vaan niiden tulee esittää eri näkökulmat tasapuolisesti ja ilman muokkaajan puolueellisuutta. Tämä koskee sekä sitä, mitä sanot, että sitä, miten sen sanot.

Kielimallit voivat tuottaa sisältöä, joka on näennäisesti neutraalia sävyltään mutta ei välttämättä sisällöltään.Tämä huoli korostuu erityisesti eläviä henkilöitä koskevissa artikkeleissa.

Vapaaehtoistyön menetys

[muokkaa | muokkaa wikitekstiä]
Asiaan liittyvä käytäntö: Wikipedia:Botit.
Katso myös: Brandolinin laki.

Wikipedia nojaa vapaaehtoistyöhön uuden sisällön tarkistamisessa. Keskeistä tässä työssä ja sen ylläpidossa on se, että ihmismuokkaajat ovat käyttäneet aikaa ja nähneet vaivaa sisältöä luodakseen. Jos tekoälyn tuottamaa sisältöä sallitaan laajasti, se vähentää ihmismuokkaajien tekemän vapaaehtoistyön arvostusta ja mielekkyyttä. Tekoälyjen luomien mainosartikkeleiden siivoaminen voi toisinaan vaatia monen tunnin työpanostusta, mikä voi kuormittaa, lannistaa ja karkottaa vapaaehtoisia. Kielimallit tulisi nähdä ensisijaisesti tehokkuutta lisäävinä apuvälineinä kokeneille muokkaajille, ei oikotienä laadukkaan sisällön tuottamiseen ilman vaivannäköä. Tavoitteena on ”nettopositiivinen” toiminta, joka ei lisää muiden vapaaehtoisten työtaakkaa.

Käyttöohjeet

[muokkaa | muokkaa wikitekstiä]

Erityisosaamista vaaditaan

[muokkaa | muokkaa wikitekstiä]

Kielimallit ovat avustavia työkaluja, eivätkä ne voi korvata inhimillistä harkintaa. Harkitse tarkkaan, soveltuuko työkalu käyttötarkoitukseesi. Muokkaajien on ymmärrettävä käyttämiensä kielimallien rajoitukset. Tietämyksensä avulla he voivat tunnistaa nämä rajoitukset, ottaa ne huomioon ja minimoida niiden vaikutukset. Lisäksi heidän muokkaustensa on oltava sopusoinnussa asiaan liittyvien ohjeiden ja käytäntöjen kanssa. Tätä varten muokkaajien olisi hankittava huomattavaa kokemusta samasta tai edistyneemmästä tehtävästä ilman kielimallin apua.[e] Huomattava perehtyneisyys ei ole määrämuotoinen kriteeri. Se tarkoittaa sitä, että muokkaaja tuntee aihealueen ja sen keskeiset lähteet riittävän hyvin arvioidakseen luotettavasti tekoälyn tuottaman tekstin oikeellisuuden, neutraaliuden ja lähdekattavuuden. Kokemusta edellytetään paitsi Wikipedian toimintatavoista, myös kielimallien oikeasta käytöstä. Tämä koskee esimerkiksi sitä, miten muotoillaan hyviä kehotteita.

Jotkut muokkaajat ovat päteviä tekemään omatoimisia muokkauksia mutta tekevät toistuvasti epäasianmukaisia kielimalliavusteisia muokkauksia, vaikka he yrittäisivät vilpittömästi osallistua. Tällaisia muokkaajia pidetään tässä mielessä epäpätevinä. He saattavat olla tietämättömiä riskeistä ja luontaisista rajoituksista tai olla tietoisia niistä, mutta eivät pääse niiden yläpuolelle varmistaakseen käytäntöjen noudattamisen. Tällaisessa tapauksessa muokkaaja voidaan estää käyttämästä tällaisia (eli hän voi tehdä muokkauksia vain ilman kielimalleja). Tämä on tietyn tyyppinen rajoitettu kielto. Vaihtoehtoisesti heille voidaan asettaa osittainen muokkausesto tiettyihin nimiavaruuksiin.

Esimerkkejä perehtyneisyydestä (havainnollistavia, eivät kynnyksiä):

  • Vahva: olet muokannut laajasti aihetta lähteistäen / opettanut tai julkaissut aiheesta
  • Kohtalainen: olet lukenut useita luotettavia lähteitä ja tunnistat niiden keskeiset väitteet
  • Heikko: et tunne alan lähteitä tai turvaudut tekoälyyn, koska et itse osaisi kirjoittaa aiheesta

Jos perehtyneisyys on heikko, vältä tekoälyavusteista sisällönmuokkausta ja keskity ensin lähteiden lukemiseen.

Merkittävä tekoälyn käyttö

[muokkaa | muokkaa wikitekstiä]

Merkittävä käyttö tarkoittaa sellaista tekoälyn (esimerkiksi kielimallien) hyödyntämistä, jolla on ollut olennaista vaikutusta muokkauksen sisältöön, rakenteeseen tai lähdepohjaan. Käyttö katsotaan merkittäväksi erityisesti seuraavissa tilanteissa:

  • kielimalli on tuottanut yhden tai useamman kokonaisen kappaleen (ei vain yksittäisiä lauseita tai sanoja)
  • kielimalli on ehdottanut tai synnyttänyt uusia lähteitä tai näkökulmia, joita ei ollut mukana ennen muokkausta
  • kielimallia on käytetty artikkeleiden tiivistämiseen, yhdistämiseen tai uudelleenmuotoiluun niin, että sisältö muuttuu merkittävästi
  • tekoälyn tuottama osuus on arviolta yli 20 % muokkauksen kokonaisuudesta (suuntaa-antavana tukimittarina).
Käyttötilanne Merkittävä käyttö? Ilmoitusvaatimus
Yksittäisen sanan tai lauseen korjaus Ei Ei
Kokonaisen kappaleen kielimalliavusteinen kirjoittaminen Kyllä Kyllä
Kielimallin ehdottama uusi lähde tai näkökulma Kyllä Kyllä
Pelkkä kieliopin tai sanajärjestyksen tarkistus Ei Ei
Useiden kappaleiden uudelleenkirjoitus kielimallien avulla Kyllä Kyllä
Tekoälyn käyttö aiheen ideointiin ilman suoraa tekstituotantoa Rajatapaus Suositellaan ilmoitusta, jos vaikutus on olennainen

Huomautus: epäselvissä tapauksissa suositellaan ilmoittamista läpinäkyvyyden varmistamiseksi.

Ilmoittaminen muokkausyhteenvedossa

[muokkaa | muokkaa wikitekstiä]

Ilmoita tekoälyavusteisesta muokkauksesta muokkausyhteenvedossa seuraavasti:

Pakollinen ilmoitus:

  • Kun ”Merkittävä käyttö” -kohdan ehto täyttyy (katso yllä).
  • Keskustelujen yhteenvedoissa, jos tekoäly osallistui sisällön/argumenttien muotoiluun.

Suositeltava ilmoitus:

  • Kun tekoäly auttoi vain kielenhuollossa (oikoluku, muutama sanakorjaus).

Yhtenäinen muoto muokkausyhteenvetoon: Muotoiltu tekoälyavusteisesti: [työkalu/versio]; käyttö: [kielenhuolto/tiivistys/uudelleenkirjoitus/kooste]; tarkistettu: [kyllä]

Esimerkki: Muotoiltu tekoälyavusteisesti: ChatGPT 4; käyttö: tiivistys ja kappaleen uudelleenkirjoitus; tarkistettu: kyllä

Kielimallit keskusteluissa

[muokkaa | muokkaa wikitekstiä]

Wikipedian keskustelut perustuvat ensisijaisesti ihmisten väliseen vuorovaikutukseen. Tekoäly voi tukea keskustelijaa, mutta ei korvata häntä.

Sallittua:

  • Kielenhuolto (esimerkiksi oikeinkirjoituksen tarkistus).
  • Tiedonhaku tai pohjatekstin muotoilu.
  • Oman tekstin selkeyttäminen ja tiivistäminen.
  • Konekäännökset, kunhan oikeellisuus tarkistetaan.

Ei suositeltavaa:

  • Kokonaan tekoälyn tuottamat kommentit, jotka esitetään ihmisen mielipiteinä.
  • Argumentointi tai päätelmät, jotka perustuvat pelkästään tekoälyn tulkintaan.

Keskustelusivuilla ilmoita tekoälyn käytöstä, jos se on auttanut olennaisesti kommentin sisältöön tai jäsentelyyn.

Esimerkki: Olen käyttänyt tekoälyä tämän kommentin muotoilussa. tai lyhyemmin: Muotoiltu tekoälyavusteisesti.

Kommenttien yhteenvedot

[muokkaa | muokkaa wikitekstiä]

Wikipedian sisäisissä asioiden muokkauksissa (esimerkiksi keskustelujen yhteenvedoissa) on kerrottava, miten kielimallia on käytetty. Tekoälyä voidaan käyttää apuna pitkien keskustelujen tiivistämisessä, analysoinnissa ja niistä yhteenvetojen luomisessa.

Tällöin on noudatettava seuraavia läpinäkyvyysvaatimuksia:

  • Käytetyn kielimallin nimi ja versio (esim. ChatGPT 4.0, Gemini Pro).
  • Tapa, jolla mallia käytettiin (esim. tiivistys, mielipiteiden tunnistaminen).
  • Kehotteiden ilmoittaminen: lyhyt kuvaus tekoälylle annetuista kehotteista (esim. Tekoälylle annettiin kehotteena: ”Tee suomenkielinen yhteenveto seuraavasta keskustelusta...”).
  • Ihmisen tarkistus: maininta siitä, onko ihminen tarkistanut ja muokannut tekoälyn tuottamaa sisältöä.

Alla on kuvitteellinen esimerkki siitä, miten tekoälyn luomiin kommenttien yhteenvetoihin voidaan sisällyttää alaviitteitä, jotka selventävät, millaisia kehotteita tekoälylle on annettu sen luodessa yhteenvetoa. Tämä menetelmä tarjoaa avoimuutta siitä, miten tekoälyä on hyödynnetty keskustelun analysoinnissa[f].

Kahvihuoneen keskustelunaiheena oli Wikipedian käytäntö koskien artikkelien kuvitusmateriaalin valintaa. Keskustelun ytimessä oli kysymys, pitäisikö suosia historiallisesti tarkkoja kuvituksia vai antaa tilaa myös taiteelliselle tulkinnalle. Monet osallistujat pohtivat, onko olemassa perusteltua syytä rajoittaa kuvamateriaalin luovuutta, etenkin kun kyse on historiallisten tapahtumien tai henkilöiden esittämisestä.

Osallistujien näkemykset jakaantuivat seuraavasti:

  • Muutoksen puolesta puhui 2 henkilöä, Taivaltaja ja Merenneito, jotka näkivät taiteellisen vapauden tuovan lisäarvoa Wikipedian artikkeleihin.
  • Muutosta vastaan oli 8 henkilöä, Aikakirja, Historioitsija, Kronikko, Arkistonvartija, Tieteenrakastaja, Faktojenetsijä, Ajanhenki ja Muinaistarinoija, jotka korostivat tarkkuuden ja historiallisen uskollisuuden merkitystä tiedonlähteenä.
  • Neutraalin kannan otti 1 henkilö, Viisastenkivi, joka vaati parempia perusteluja muutokselle.
  • Sivustakatsojina oli 3 henkilöä, Aikajana, Kartanpiirtäjä ja Kirjastonhoitaja, jotka eivät halunneet asettua selkeästi kummallekaan puolelle mutta seurasivat keskustelua mielenkiinnolla.

Yhteenveto: Kahvihuoneen keskustelussa 2 henkilöä kannatti kuvitusmateriaalin taiteellisen vapauden lisäämistä, 8 vastusti tätä muutosta painottaen historiallisen tarkkuuden tärkeyttä, ja 4 henkilöä ei ottanut suoraa kantaa asiaan. Keskustelun perusteella vaikuttaa siltä, että enemmistö osallistujista suosii nykyisen käytännön säilyttämistä, jossa korostetaan tarkkuutta ja faktapohjaisuutta kuvitusmateriaalin valinnassa.[chatgpt 1][chatgpt 2][chatgpt 3]

Viitteet
  1. ChatGPT malli GPT-4 syötteenään: Tee suomeksi yhteenveto seuraavan keskustelun tuloksesta: + koko keskustelun sisältö wikitekstinä lainausmerkkien sisällä
  2. ChatGPT malli GPT-4 syötteenään: kuinka moni kannatti ja kuinka moni vastusti muutosta seuraavassa keskustelussa? + koko keskustelun sisältö wikitekstinä lainausmerkkien sisällä
  3. ChatGPT jätti MattiMeikäläisen, MaijaMeikäläisen ja Medelsvenssonin huomioimatta luvuissa.

Artikkelien kirjoittaminen

[muokkaa | muokkaa wikitekstiä]

Kielimalleja voi käyttää tekstin tarkistamiseen, tiivistämiseen tai ideoiden luomiseen uusille tai olemassa oleville artikkeleille. Kaikkien muutosten on noudatettava sovellettavia sääntöjä ja ohjeita:

  • Tutustu lähteisiin ja varmista tuotetun tekstin tarkistettavuus
  • Säilytä neutraali näkökulma ja arvioi asianmukaisesti vähemmistönäkökulmat
  • Noudata tekijänoikeuksia ja kaikkia sovellettavia käytäntöjä
  • Varmista, että lähteet ovat luotettavia, asiaan liittyviä ja asianmukaisia

Tekoälyn käyttö eroaa sen mukaan, tuotetaanko sillä vain muotoiltua sisältöä (sallittu) vai uutta, lähteistämätöntä sisältöä (kielletty).

Ei sallittua (uusi tekoälytuotos):
✗ Tekoäly tuottaa väitteitä, joita ei ole lähteissä
✗ Tekoäly "keksii" näkökulmia tai faktoja, joita ei voi osoittaa lähteistä
✗ Tekoälyehdotuksia käytetään lähteinä ilman riippumatonta tarkistusta.

Sallittu — uudelleenkirjoitus/tiivistys (ehdollisesti):
✓ Tekoäly muotoilee jo lähteistettyjä väitteitä selkeämmiksi
✓ Ihminen varmistaa, että merkitys ei muutu ja kaikki väitteet ovat lähteissä
✓ Ilmoita käytöstä, jos ehto ”Merkittävä käyttö” täyttyy.

Artikkelien luonnostelu ennen julkaisua

[muokkaa | muokkaa wikitekstiä]

Ennen kielimallin tuottaman sisällön lisäämistä artikkeliin, tallenna artikkeli luonnokseksi (esim. käyttäjän omalle alisivulle). Kielimallin tuottama sisältö voi muuttaa artikkelia merkittävästi, joskus entistä sekavammaksi. Näin voit verrata tuotosta alkuperäiseen ja tehdä tarvittavat korjaukset ennen julkaisua.

Tekoälyn tuottama multimediasisältö

[muokkaa | muokkaa wikitekstiä]
Asiaan liittyvä säädös: EU:n tekoälyasetus (soveltuvin osin).
Katso myös: Commons:AI-generated media.

Wikipediaan tallennettu tekoälyllä luotu tai merkittävästi muokattu multimediasisältö (kuvat, ääni, video) on aina merkittävä selkeästi tekoälyn tuottamaksi tiedoston kuvaussivulla. Tämä koskee tiedostoja, jotka on ladattu joko Wikimedia Commonsiin tai paikallisesti (esim. sitaattioikeudella).

Perussäännöt

  • Älä käytä tekoälyluotuja kuvia esittämään todellisia, nimettyjä henkilöitä.
  • Vältä tekoälykuvia artikkeleissa, joissa vaaditaan tarkkaa tai tieteellistä kuvausta (anatomia, kemia, tekniset aiheet).
  • Tekoälykuvia ei tule käyttää esittämään todellisia paikkoja tavalla, joka voi johtaa lukijaa harhaan.
  • Poikkeuksia voidaan tehdä artikkeleissa, jotka käsittelevät tekoälyä tai tekoälyn tekemiä teoksia sinällään.

Merkittävä vs. vähäinen muokkaus (“photoshop-poikkeus”)

Merkittävä muokkaus = Tekoälyavusteinen muokkaus, joka muuttaa kuvan asiasisältöä:

  • objektien lisääminen/poistaminen,
  • generatiivinen täyttö,
  • montaasit,
  • muutokset, jotka muuttavat todellisuutta kuvaavia faktoja.

Ei-merkittävä (tekoälymerkintää ei tarvita):

  • rajaus, valotus, kontrasti,
  • kohinanpoisto ja tekninen korjaus,
  • tekoälyavusteinen terävöitys tai skaalaus, kun sisältö ei muutu.

Merkitseminen ja läpinäkyvyys

  1. Merkitse selkeästi Commonsin AI-malleilla.
  2. Ilmoita käytetty työkalu ja versio (esim. Midjourney, Stable Diffusion).
  3. Kuvaa lyhyesti luomisen ja muokkauksen vaiheet.

Miksi tekoälykuvien käyttöä rajataan

Synteettinen media voi näyttää todelliselta ja siten johtaa lukijaa harhaan. Selkeä merkintä ja harkittu käyttö suojaavat artikkelien tarkkuutta ja luotettavuutta.

Epäilyttävän kielimallisisällön käsittely

[muokkaa | muokkaa wikitekstiä]

Jos huomaat Wikipedia-artikkelissa sisältöä, joka vaikuttaa olevan kielimallin tuottamaa ja jonka tarkistettavuus on epävarma, noudata seuraavia ohjeita:

Tarkista lähteet ensin

[muokkaa | muokkaa wikitekstiä]
  • Tämä on tärkein yksittäinen toimenpide. Varmista, että artikkelissa viitatut lähteet ovat todellisia ja saatavilla.
  • Tarkista, että väitteet vastaavat lähteitä. Kielimallit voivat keksiä uskottavan kuuloisia mutta virheellisiä tai täysin olemattomia viitteitä ja lähteitä (ns. hallusinaatiot).

Jos lähteet ovat epäselviä tai puuttuvat

[muokkaa | muokkaa wikitekstiä]
  • Lisää {{Lähde}}-malline kohtiin, joista puuttuu luotettava lähde.
  • Jos sisältö on kyseenalaista, käytä {{Tarkistettava}}-mallinetta ja perustele epäilyksesi artikkelin keskustelusivulla.
  • Jos sisältö on selvästi väärää, poista se ja perustele muokkausyhteenvedossa (esim. ”Poistettu virheellinen tieto, joka vaikuttaa kielimallin tuottamalta ja jonka lähdettä ei löydy.”).

Jos epäilet laajempaa kielimallisisältöä

[muokkaa | muokkaa wikitekstiä]
  • Käytä mallinetta {{Tekoälysisältö}} merkitäksesi koko sivun tai tietyn osion tarkistettavaksi:
    • Koko sivulle: {{Tekoälysisältö|date=elokuu 2025}}
    • Yhdelle osiolle: {{Tekoälysisältö|section=kyllä|date=elokuu 2025}}
  • Selitä epäilyksesi artikkelin keskustelusivulla.
  • Malline lisää sivun seurantaluokkaan Luokka:Artikkelit, jotka saattavat sisältää tekoälyn tuottamaa sisältöä ja auttaa muita muokkaajia löytämään tarkistettavaa sisältöä.
  • Väärinkäyttösuodatin Suodattimen 186 loki listaa automaattisesti muokkauksia, joissa on merkkejä tekoälypohjaisista lähdelinkeistä.

Jos koko artikkeli perustuu kielimallin sepitteisiin

[muokkaa | muokkaa wikitekstiä]
  • Ehdota artikkelin poistoa poistokeskustelussa.
  • Jos kyseessä on selkeä vandalismi tai täysin keksitty sisältö, ehdota pikapoistoa perustelulla Y3 (Vandalismi).

Vinkkejä kielimallin tuottaman tekstin tunnistamiseen

[muokkaa | muokkaa wikitekstiä]

Kielimallin tuottaman sisällön varma tunnistaminen on vaikeaa, ja mikään yksittäinen piirre ei riitä todisteeksi tekoälyn käytöstä. Tietyt piirteet voivat kuitenkin herättää epäilyksen, ja arvioinnin tulee perustua lähteisiin.

  • Kieli ja tyyli:
    • Ylikorostetun siloiteltu, ylikorrekti, muodollinen tai koukeroinen kieli, joka on kuitenkin sisällöltään onttoa tai latistettua.
    • Toistuvat, täytemäiset fraasit, kuten ”on tärkeää huomata”, ”kaiken kaikkiaan” tai ”yhteenvetona voidaan todeta”.
    • Tekoälymäisyydet ja itseviitteisyys, kuten poistamatta jääneet fraasit ”tekoälymallina en voi” tai muut vastaavat.
  • Sisältö ja lähteet:
    • Virheelliset, epätäydelliset tai täysin keksityt lähteet.
    • Harhaanjohtavat viittaukset olemattomiin asiantuntijoihin, kirjoihin tai instituutioihin.
    • Yleistiedon epätarkka tai asiayhteydestä irrallinen käyttö erikoisalojen aiheissa.
Älä käytä tekoälyn tunnistustyökaluja!
Tekoälyn tuottaman tekstin tunnistamiseen markkinoidut työkalut (kuten GPTZero, Copyleaks jne.) eivät ole luotettavia. Toisin kuin plagiaatintunnistusjärjestelmät, jotka vertaavat tekstiä olemassa oleviin lähteisiin, nämä työkalut yrittävät arvata tekstin alkuperää tilastollisten mallien perusteella. Tekoälyn tunnistustyökalujen tulokset voivat olla sattumanvaraisia, ja erityisesti väärien positiivisten (työkalu väittää ihmisen kirjoittamaa tekstiä tekoälyn tuottamaksi) määrä on korkea. Älä perusta muokkauksiasi, kommenttejasi tai syytöksiäsi pelkästään näiden työkalujen antamiin tuloksiin. Arvioi sisältöä sen perusteella, täyttääkö se Wikipedian vaatimukset tarkistettavuuden ja luotettavien lähteiden suhteen.

Epäilyttävä tekoälysisältö keskusteluissa

[muokkaa | muokkaa wikitekstiä]

Jos epäilet, että Wikipedian keskustelusivulla (kuten artikkelin keskustelusivulla, kahvihuoneessa tai käyttäjäsivun keskustelusivulla) oleva kommentti on kokonaan tai osittain kielimallin tuottama eikä käyttäjä ole ilmoittanut asiasta, voit toimia seuraavasti:

  • Ole kohtelias: kysy kommentin kirjoittajalta ystävällisesti, onko hän mahdollisesti käyttänyt tekoälyä kommentin muotoilussa. Voit viitata tähän ohjeeseen.
  • Huomioi keskustelun kulku: jos kommentti vaikuttaa irralliselta, epäloogiselta tai toistavan samoja asioita eri sanoin, se voi olla merkki kielimallin käytöstä.

Muokkaajien ohjeistaminen

[muokkaa | muokkaa wikitekstiä]
  • Jos muokkaaja toistuvasti lisää kielimallien tuottamaa tarkistamatonta sisältöä, ohjaa hänet Wikipedia:Tarkistettavuus- ja Wikipedia:Luotettavat lähteet -käytäntöihin.
  • Voit käyttää keskustelusivulla mallinetta {{Tekoälyn käyttöhuomautus}} huomauttaaksesi muokkaajalle epäilyttävästä tekoälysisällöstä. Mallinetta käytetään erityisesti tilanteissa, joissa muokkaus on kumottu tekoälyn käytön vuoksi tai se vaikuttaa selvästi tekoälyn tuottamalta. Lisää malline seuraavasti: {{subst:Tekoälyn käyttöhuomautus|artikkelin_nimi}} --~~~~
  • Yliviivaus: jos kirjoittaja ei vastaa ja teksti on selvästi kielimallituotos ilman ilmoitusta, voit yliviivata ongelmallisen kohdan ja lisätä selitteen muokkausyhteenvedossa.
    • Esimerkki: <s>Ongelmallinen teksti</s> → Ongelmallinen teksti
    • Muokkausyhteenvedon esimerkki: Yliviivattu: selvä kielimallituotos ilman ilmoitusta.
  • Pitkien tekoälykommenttien häivyttämiseen voidaan käyttää {{Collapse}}-mallinetta. Tämä parantaa keskustelun luettavuutta.
  • Jos ongelmat jatkuvat, ilmoita asiasta Tekoälyvalvomon ilmoitustaululle. Kiireellisissä tapauksissa, jotka vaativat välittömiä ylläpitotoimia (kuten käyttäjän esto tai artikkelin pikapoisto), voit ilmoittaa suoraan ylläpitäjille.

Yleiset periaatteet

[muokkaa | muokkaa wikitekstiä]
  • Tarkista kaikki epäillyt kielimallien tuottamat tekstit huolellisesti. Suhtaudu niihin lähtökohtaisesti epäluotettavina, kunnes niiden paikkansapitävyys on varmistettu lähteistä. Kielimallit voivat väärentää lähteitä, kuten kirjoja, lehtiartikkeleita ja verkkolinkkejä, joten varmista ensin, että viitatut teokset todella ovat olemassa. Kaikki faktatiedot on sitten tarkistettava toimitetuista lähteistä. Kiistanalainen tai vahvistamaton kielimallista peräisin oleva sisältö tulee poistaa.

Jos yllä mainitut toimenpiteet johtavat siihen, että koko artikkeli tai luonnos on tyhjennettävä tai vaikuttaa täysin virheelliseltä tai perustuu väärennettyihin lähteisiin, voidaan sivun poistoa harkita ohjeiden mukaisesti (katso tarkemmat ohjeet yllä kohdasta ”Jos koko artikkeli perustuu kielimallin sepitteisiin”).[g]

Yhteenveto kielimallien käyttökohteista

[muokkaa | muokkaa wikitekstiä]

Tämä taulukko tiivistää kielimallien keskeiset sallitut ja ei-suositellut/kielletyt käyttötavat suomenkielisessä Wikipediassa tämän ohjeen mukaisesti.

Kielimallien käytön yhteenveto (lajittele klikkaamalla otsikoita)
Värikoodit: Kielletty, Ei suositeltavaa, Sallittu (tietyin ehdoin)
Käyttötarkoitus Status Keskeiset ehdot ja huomiot Viittaus ohjeen kohtiin
Alkuperäisen artikkelisisällön luominen (kokonaiset artikkelit, merkittävät osiot) Kielletty Älä julkaise tekoälyllä luotuja uusia väitteitä tai lähteitä. Tekoälyä saa käyttää vain valmiiksi lähteistetyn sisällön tiivistämiseen ja kielenhuoltoon, kunhan alkuperäinen merkitys säilyy ja viitteet tarkistetaan. 1, Artikkelien kirjoittaminen tai ”hallusinaatiot”
Lähteiden etsiminen / luominen / viittaaminen Kielletty Kielimallit voivat keksiä olemattomia lähteitä (”hallusinoida”). Artikkeleiden tietojen lähteet on aina varmennettava luotettavista julkaisuista. 5, Lähteetön, ”hallusinaatiot”
Kokeilut ja testaus artikkeliavaruudessa Kielletty Wikipedia ei ole kielimallien koelaboratorio. Testaus ja luonnostelu on sallittua vain käyttäjän käyttäjäsivulla ja/tai hiekkalaatikossa. 8
Keskustelukommenttien tai argumenttien luominen Ei suositeltavaa Älä esitä tekoälyn luomaa kommenttia tai päättelyä omanasi. Tämä heikentää aitoa keskustelua ja luottamusta. Keskustelut
Ideoiden ja jäsentelyjen luominen Sallittu (tietyin ehdoin) Vain lähtökohtana. Vaatii aina ihmisen, jolla on asiantuntemusta aiheesta, perusteellisen tarkistuksen, lähteistyksen ja merkittävän muokkauksen. Artikkelien kirjoittaminen
Olemassa olevan tekstin kielen korjaus/parantelu (kieliasu, selkeys, kielioppi) Sallittu (tietyin ehdoin) Vaatii aina ihmisen huolellisen tarkistuksen (mallit voivat tehdä virheitä tai muuttaa merkitystä). Ilmoita käytöstä muokkausyhteenvedossa. 2, 3, Ilmoitus
Tekstin tiivistäminen ja/tai uudelleenmuotoilu Sallittu (tietyin ehdoin) Vaatii aina ihmisen huolellisen tarkistuksen (varmista, ettei oleellista tietoa katoa tai merkitys vääristy). Ilmoita käytöstä muokkausyhteenvedossa. 2, 3, Ilmoitus
Kielenhuolto omissa keskusteluviesteissä (oikeinkirjoitus yms.) Sallittu Sallittu avustava käyttö oman, itse kirjoitetun viestin selkeyttämiseksi. Keskustelut
Tiedonhaku / pohjatekstin muotoilu keskusteluissa Sallittu (tietyin ehdoin) Käytä vain apuna oman argumentin muodostamisessa. Ilmoita käytöstä, jos apua on käytetty merkittävästi. Älä esitä tekoälyn tuotosta omanasi. Keskustelut
Keskustelujen yhteenvetojen luominen Sallittu (tietyin ehdoin) Vaatii erityistä läpinäkyvyyttä: käytetty malli/versio, käyttötapa, annetut kehotteet ja maininta ihmisen tekemästä tarkistuksesta on ilmoitettava selkeästi. Yhteenvedot
Multimediasisällön (kuvat, ääni, video) luominen Sallittu (tietyin ehdoin) Tekoälyn luoma tai merkittävästi muokkaama sisältö on merkittävä selkeästi Wikimedia Commonsissa asianmukaisilla mallineilla. Multimedia


Ohjeiden ajantasaisuus ja kehittäminen

[muokkaa | muokkaa wikitekstiä]

Tekoälyteknologia kehittyy nopeasti, ja tämän ohjeen on pysyttävä ajantasaisena. Ohjeen säännöllinen tarkistaminen ja päivittäminen on välttämätöntä, jotta se pysyy relevanttina tekoälyn ja sen sovellusten muuttuessa.

Teknologian muuttuvuus ja sen vaikutukset

[muokkaa | muokkaa wikitekstiä]

Tekoälyn kenttä on laajempi kuin pelkät kielimallit, ja se kehittyy jatkuvasti. Tämän vuoksi ohjeen on oltava joustava ja mukautuva. Tavoitteena on ymmärtää miksi ohjeistusta tarvitaan jatkuvasti kehittyvässä ympäristössä, ei niinkään tuntea yksityiskohtaisesti kaikkia uusia teknologioita.

Ohjeen ylläpito ja tarkistusprosessi

[muokkaa | muokkaa wikitekstiä]

Suomenkielisen Wikipedian yhteisö on vastuussa tämän ohjeen ylläpidosta ja ajantasaisuuden varmistamisesta. Ohje tulee tarkistaa järjestelmällisesti:

  • vähintään kerran vuodessa kokonaisuutena,
  • tarvittaessa useammin, erityisesti jos teknologinen kehitys tai uudet käyttötavat sitä edellyttävät.

Tarkistusprosessi käynnistetään Wikiprojekti:Tekoälyvalvomon keskustelusivulla. Prosessiin kuuluu:

  • Tilannekatsaus: yhteenveto tekoälyteknologian ja sen sovellusten viimeaikaisesta kehityksestä.
  • Vertailu: katsaus siihen, miten muut Wikipediat ovat päivittäneet ohjeitaan.
  • Päivitysehdotusten käsittely: Yhteisön keskustelu ja päätöksenteko päivitystarpeista konsensusperiaatteella. Tässä yhteydessä arvioidaan myös teknologian muutosten vaikutukset ohjeen muihin osiin (esim. riskit ja sallitut käyttötavat).

Ajankestävien esimerkkien käyttö ja viittaukset

[muokkaa | muokkaa wikitekstiä]

Ohjetekstissä suositaan yleistermejä, kuten tekoälytyökalu, kielimalli tai generatiivinen kielimalli, sen sijaan, että käytettäisiin nopeasti vanhenevia mallinimiä (esim. "ChatGPT 4.0" tai "Claude 3 Opus"). Esimerkeissä ja muokkausyhteenvedoissa voidaan käyttää tarkempia viittauksia työkaluihin, mutta nämä viittaukset eivät saa muodostaa normatiivista suositusta tietyn työkalun käytöstä. Hyvä käytäntö on ilmoittaa käytetyn työkalun nimi ja mahdollisuuksien mukaan versio muokkausyhteenvedossa.

  • Esimerkki (vältettävä): "Koska ChatGPT 4.0 tuottaa usein täsmällisempiä viitteitä kuin GPT-3.5, sen käyttöä suositellaan..."
    (Tällaiset tiedot vanhenevat nopeasti ja sitovat ohjeen tiettyihin malleihin ja ajankohtaan.)
  • Parempi esimerkki: "Laajennettu kappaletta käyttäen apuna tekoälytyökalua lähteiden tiivistämiseen ja tekstin jäsentelyyn. Työkalu: [Työkalun nimi ja versio, esim. ChatGPT 4]."

Huomautus historiallisesta kehityksestä: Ohjeessa voi esiintyä aiemmista vaiheista peräisin olevia täsmällisiä malliversioita tai esimerkkejä, jotka eivät noudata yleistämisperiaatetta. Ne on syytä ymmärtää historiallisiksi maininnoiksi. Tavoitteena on siirtyä kohti ajankestävämpää terminologiaa.

Tämä ohje asettaa perusperiaatteet tekoälyn vastuulliselle käytölle Wikipediassa. Tarkoituksena on ohjata teknologian hyödyntämistä tavalla, joka pitää riskit hallinnassa jatkuvasti muuttuvassa toimintaympäristössä. Ohje antaa selkeät suuntaviivat tekoälyn käyttöön ja toimii pohjana myös tuleville teknologioille.

Viimeksi tarkistettu: 18.1.2026.

  1. Ohjetta tukee se, että AutoWikiBrowserin ja HotCatin kaltaiset muokkausohjelmat jättävät muokkauksiin merkinnän käytetystä ohjelmasta. Nämä muokkausyhteenvetojen merkinnät ovat ”using AWB” ja "HotCat-työkalulla”.
  2. Tämä koskee myös tapauksia, joissa tekoälymalli toimii lainkäyttöalueella, jossa pelkästään tekoälyn luomat teokset eivät ole tekijänoikeudellisesti suojattuja.
  3. Tilanne muuttunee jatkuvasti, kun lainsäädäntö eri maissa muuttuu ajan mittaan.
  4. Aiheesta on laajemmin tietoa artikkelissa Malliromahdus.
  5. Esimerkiksi käyttäjän, joka on taitava vandalismin torjunnassa mutta jolla on vain vähän kokemusta artikkelien luomisesta, ei tulisi aloittaa niiden kirjoittamista kielimallien avulla. Ensin tulisi hankkia käytännön kokemusta artikkelien tuottamisesta ilman kielimallin apua. Sama logiikka pätee myös vaativampiin osa-alueisiin, kuten mallineiden ja moduulien luomiseen.
  6. Tämä menettelytapa on omaksuttu Wikipedian kahvihuoneen keskustelusta: Löytyykö tälle määräykselle älyllistä perustetta (keskustelu päättyi noin 21.3.2023). Tämä on kuvitteellinen esimerkki havainnollistamaan asiaa.
  7. Tämä ohje koskee tilanteita, joissa artikkeli koostuu pääosin muokkaamattomasta kielimallin tuottamasta tekstistä. Jos aihe voi olla merkittävä, artikkelia ei välttämättä tarvitse poistaa kokonaan – se voidaan tiivistää hyvin lyhyeksi tyngäksi tai ohjata muualle. Myös uusista aiheista tehdyt lyhyet ”runkoartikkelit”, jotka sisältävät vain aiheen perustiedot, voivat olla hyödyllisiä. Sivun luoneelle muokkaajalle tulee antaa asianmukainen ilmoitus. Kielimallisisällön käsittelyssä muokkaajien (etenkin sisällön alun perin lisänneiden) tulisi pidättäytyä kumoamasta poistoa ilman ennakkokeskustelua. Varmista aina, että sisällössä ei ole tekijänoikeusongelmia tai muita kriittisiä puutteita, vaikkei artikkelia poistettaisikaan kokonaan.
  1. Smith, Adam: What is ChatGPT? And will it steal our jobs? (Otsikko suomeksi: Mikä on ChatGPT? Ja viekö se työpaikkamme?) Context. 25.1.2023. Thomson Reuters Foundation. Arkistoitu 15.3.2023. Viitattu 24.8.2023. (englanniksi)
  2. Growcoot, Matt: Japan Declares AI Training Data Fair Game and ‘Will Not Enforce Copyright’ (Otsikko suomeksi: Japani julistaa tekoälyn koulutusdatan reiluksi peliksi eikä 'valvo tekijänoikeuksia') PetaPixel. 5.6.2023. Arkistoitu 26.10.2023. Viitattu 26.10.2023. (englanniksi)
  3. Yhteiskuntatieteiden ja filosofian laitos, linjaus kielimallien käytöstä opiskelussa (PDF) (Kielimallit ja opiskelu, linjaus) 10.5.2023. Jyväskylän yliopisto. Arkistoitu 13.6.2025. Viitattu 10.5.2023.
  4. Lin, Connie: How to trick OpenAI’s ChatGPT Fast Company. 5.12.2022. Mansueto Ventures. Arkistoitu 11.2.2024. ”When Fast Company asked ChatGPT to write up a quarterly earnings story for Tesla, it spit back [...] it also plugged in a random set of numbers that did not correspond to any real Tesla report.” [Lainaus suomeksi:] ”Kun Fast Company pyysi ChatGPT:tä kirjoittamaan Teslaa koskevan neljännesvuosikatsauksen, se tuotti [...] mutta se myös lisäsi siihen satunnaisia lukuja, jotka eivät vastanneet mitään todellista Teslan raporttia.” Viitattu 9.3.2024. (englanniksi)

Aiheesta muualla

[muokkaa | muokkaa wikitekstiä]