Turingin testi

Wikipedia
Loikkaa: valikkoon, hakuun

Turingin testi eli Turingin koe on Alan Turingin 1950 esittämä tapa kysymyksen "voivatko koneet ajatella?" ratkaisuun. Koe on tarkoitettu mittaamaan tekoälyn ihmismäisyyttä asettamalla se keskustelemaan kokeen tarkkailijana toimivan ihmisen kanssa. Ajatuksena on, että tietokone on älykäs, jos sen vastauksia ei pysty erottamaan ihmisen vastauksista, eli tarkkailija ei osaa sanoa, onko keskustelukumppani ihminen vai kone. Turingin testin läpäisevä tekoäly onnistuu siis ainakin vaikuttamaan ajattelevalta. Jotta kokeen kielellisiä taitoja mittaava universaali luonne säilyisi, toteutetaan se tekstipohjaisesti.

Alan Turing kuvasi tekoälytestin 1950 ilmestyneessä julkaisussaan Computing machinery and intelligence. Testiä alettiin myöhemmin kutsua hänen mukaansa. Siitä on tullut tekoälytutkimuksen klassikko.

Ajatus[muokkaa | muokkaa wikitekstiä]

Turingin testin alkusysäyksenä oli tarve pystyä esittämään kysymys "voivatko koneet ajatella" siten, ettei törmättäisi käsitteiden "kone" ja "ajattelu" määrittelyongelmiin. Alan Turing kuvaili artikkelissaan käytännöllisen kokeen, jossa hyödynnettävät käsitteet ovat yksiselitteisiä. Testin innoituksena on matkimispeli, jossa mies ja nainen yrittävät tekstivälitteisesti kysymyksiin vastaamalla uskotella muille olevansa toista sukupuolta kuin ovat. Turingin versiossa kuvataan tällaisen pelin tilanne, jossa sekä mies että nainen yrittävät osoittaa olevansa naispuolisia, ja kuvitellaan, mitä tapahtuisi, jos esimerkin miehen tilalle vaihdettaisiin kone. Turing kysyy, pystyisikö kone esittämään uskottavasti ihmistä tällaisessa viestien vaihdossa.

Turingin testi yksinkertaistetaan käytännössä kahdenväliseksi kommunikaatioksi kysyjän ja vastaajan välille, vastaajan ollessa joko ihminen tai ihmistä esittävä kone. Turingin artikkelissaan esittelemässä alkuperäisessä matkimispelissä on kolme osanottajaa, kysyjä sekä kaksi vastaajaa, joista esimerkissä toinen yrittää näytellä jotain muuta kuin on, toisen yksinkertaisesti yrittäessä todistaa olevansa sitä mitä onkin. Testin periaatteen kannalta pelaajien määrä ei ole tärkeä, kunhan siinä vain on kysyjä sekä olemukseltaan tuntematon vastaaja.

Yksityiskohtia[muokkaa | muokkaa wikitekstiä]

Koska testi on sovellus matkimispelistä, ei sen voida sanoa mittaavan suoranaisesti älykkyyttä eikä etenkään ajattelua. Testissä voisi pärjätä oikeasti älykäs ja ajatteleva kone, mutta ilmeisesti siinä voisi yhtä lailla pärjätä kone, joka vain jäljittelee ihmismäistä käytöstä riittävän tarkasti esimerkiksi hyvin suuren vastausrepliikkejä sisältävän tietokannan avulla. Jälkimmäisessä tapauksessa konetta tuskin voisi pitää missään mielessä ajattelukykyisenä, vaikka se läpäisisikin testin.

Turingin testin tarkoitus on selvittää tietokoneen kykyä ihmismäiseen kielelliseen kommunikaatioon, joten kommunikaatioväline ei ole olennainen. Testi toteutetaan siis kirjallisesti, kokeentekijän esimerkiksi kirjoittaessa kysymyksensä näppäimistöltä ja saadessa vastaukset tekstinä näyttöpäätteelle. Näin ei aseteta vaatimuksia erillisille viestinlaitteille kuten puhesyntetisaattoreille, jotka olisivat epäolennaisia testattavan asian eli koneen älykkyyden kannalta. Tähän liittyvä sovellus on totaalinen Turingin testi, jossa hyödynnetään ääni- ja videosignaalia ja kone (robotti) ei ole ulkonäöltään tai ääneltään erotettavissa ihmisestä, sen lisäksi että läpäisee tavallisen Turingin testin.

Vastakkaisia näkökohtia[muokkaa | muokkaa wikitekstiä]

Ennen Turingia ei koneiden ajattelukyvyn testaamiseen ollut esitetty helppotajuista koetta. Koneiden ajattelu oli kuitenkin suosittu keskustelunaihe, ja sekä sen puolesta että sitä vastaan oli käytetty puheenvuoroja. Niinpä Turing käsitteli artikkelissaan joitakin vastaväitteitä, joilla hänen koettaan voitaisiin kritisoida, ja vastasi niihin:

  1. Teologinen vastalause: Tämän mukaan ajattelu liittyy ihmisen kuolemattomaan sieluun, eikä siten ole mahdollista eläimille saati koneille. Vastalause on epätieteellinen, mutta Turing huomauttaa kuitenkin, ettei kaikkivoivalle jumalalle varmastikaan olisi mahdotonta antaa sielua koneellekin, jos niin haluaisi.
  2. "Päät painettuina hiekkaan" -vastalause: "Seuraukset koneiden ajattelukyvystä olisivat kammottavia. Toivokaamme etteivät ne pysty siihen." Kysymyksessä on argumentum ad consequentiam, seurauksiin vetoava argumentaatiovirhe; asian epätoivottavuus ei estä sen olemassaolon mahdollisuutta.
  3. Matemaattinen vastalause: Tämä käyttää matemaattisia teorioita, kuten Gödelin epätäydellisyyslausetta, osoittaen rajoitukset sille, millaisiin kysymyksiin looginen tietokonejärjestelmä voi vastata. Turing katsoo ihmistenkin olevan usein väärässä, joten koneen mahdollisuus väärin vastaamiseen ei haittaa.
  4. Tietoisuusargumentti: Tämä professori Geoffrey Jeffersonin 1949 esittämä perustelu väittää, että "vasta kun kone voi kirjoittaa sonetin tai säveltää konsertin tuntemiensa ajatusten ja tunteiden pohjalta, eikä sattuman kautta, voidaan konetta pitää aivojen vertaisena". Turing vastaa, ettei meillä itse asiassa ole varmaa tapaa tietää, tunteeko yksikään olento itseämme lukuun ottamatta tunteita, emmekä siis voi hyväksyä tällaista vastalausetta.
  5. Erinäisten rajoitusten argumentit: Usein esitetään vastalauseita, joiden mukaan kone ei koskaan pystyisi johonkin tiettyyn asiaan, kuten tunteisiin, huumorintajuun, uusien asioiden oppimiseen tms. Turing ei pidä näitä vastalauseita perusteltuina, ja huomauttaa koneiden silminnähtävien rajoitusten olevan seurausta tuonaikaisesta hyvin vähäisestä tallennuskapasiteetista ja konetehosta, eikä jostain ylittämättömästä esteestä.
  6. Lady Lovelace -vastalause: Tämän kuuluisan vastalauseen mukaan koneet eivät kykene omaperäisyyteen. Soveltaen se toteaa, ettei tietokone voi tehdä mitään oikeasti uutta. Toteamuksen alkuperäinen esittäjä on itse Ada Lovelace, jonka mukaan koneelta puuttuu kyky itsenäiseen oppimiseen. Turing esittää vastineessaan, että Lady Lovelacen oletukseen on vaikuttanut teknisen kehityksen silloinen taso, ja että uudemman tieteellisen tiedon perusteella on ilmeistä, että aivoilla ja tietokoneilla on paljon yhteistä.
  7. Hermojärjestelmän jatkuvuus (tiedonkäsittely) -vastalause: Kone käsittelee tietoa merkki kerrallaan, ihminen holistisesti. On esitetty, ettei erillisten tilojen pohjalta toimiva kone voi jäljitellä hermojärjestelmää; matkimispelissä tämä ei kuitenkaan aiheuta ongelmaa. (Viimeaikainen kehitys rinnakkaislaskennan ja sumean logiikan tukimuksessa on lähentänyt tällaisen koneen toimintaa ihmisen hermojärjestelmään tapaan.)
  8. Vapaamuotoinen käyttäytyminen (vapaa tahto): Vastalauseessa esitetään, että määrättyjen sääntöjen mukaan toimiva järjestelmä on ennustettavissa eikä siten aidosti älykäs. Turing vastaa, ettei jokaista tilannetta varten erikseen määriteltyjä sääntöjä tulisi sekoittaa ohjeluontoisiin yleisiin toimintatapoihin, ja että sääntöjen ollessa riittävän löyhästi määriteltyjä (vrt. ihminen) olisi koneen käytöksen ennustaminen hyvin vaikeaa.
  9. Yliaistinen havaitseminen: Tässä kohdassa Turing vaikuttaa väittävän, että olisi olemassa todisteita (näennäistieteellisestä) "yliaistillisesta havaitsemisesta". Esittelemänsä testin suhteen hän kuitenkin toteaa, ettei tällainen "telepatia" pääsisi vaikuttamaan tuloksiin, mikäli testiolosuhteet järjestetään oikein.

Ongelmia[muokkaa | muokkaa wikitekstiä]

Usein esitetty kritiikki Turingin testiä kohtaan toteaa, että se, vaikkakin mielenkiintoinen, ei ole käyttökelpoinen määrittelemään koneen älykkyyttä tai ajattelua ainakaan seuraavista syistä: ensinnäkin testin läpäisevä kone voi kyllä matkia ihmisen keskustelukäyttäytymistä, mutta olla silti vailla älykkyyttä, seuraten vain nokkelasti määriteltyjä sääntöjä. Tekoälytutkimuksessa tähän vastataan joskus, ettemme voi tietää, seuraavatko ihmisetkin tällaisia sääntöjä. Esimerkki kritiikistä on John Searlen kiinalaisen huoneen argumentti. Toiseksi, kone voi hyvinkin olla älykäs, vaikkei osaisikaan jutustella ihmisen lailla. Kolmanneksi, monet älykkäinä pidetyt ihmisetkin, esimerkiksi lapset tai lukutaidottomat, saattaisivat epäonnistua testissä.

Edellisiin liittyen huomautetaan usein myös, että vaikka Turingin testi antaisikin hyvän määritelmän älykkyydelle, ei se silti välttämättä kerro mitään koneen mahdollisesta tietoisuudesta, ajattelusta tai sen toiminnan intentionaalisuudesta. Sangen yleisen näkemyksen mukaan älykkyys ei edellytä tietoisuutta, mahdollisesti näin on toisin päinkin. Monilla nykyaikaisilla tekoälysovelluksilla on älykkyyttä siinä mielessä, että ne oppivat asioita, mutta mitä ilmeisimmin niiltä silti puuttuu tietoisuus, eivätkä ne toimi intentionaalisesti.

Käytäntö[muokkaa | muokkaa wikitekstiä]

Alan Turing ennusti koneiden ennen pitkää läpäisevän esitetyn testin. Hän arvioi, että viidenkymmenen vuoden kuluessa, siis vuoteen 2000 mennessä, tietokone voitaisiin ohjelmoida pelaamaan matkimispeliä niin taitavasti, että keskimääräisellä kuulustelijalla olisi enää 70% mahdollisuus tunnistaa se koneeksi viiden minuutin kyselytuokion aikana. Samaten hän ennusti, etteivät ihmiset tuolloin enää pitäisi ajattelevan koneen käsitettä itsessään ristiriitaisena, ja päätteli koneoppimisen olevan tärkeä osa tehokkaiden koneiden kehittämisessä, mitä pidetään pätevänä ennusteena.

Testin läpäiseminen ei kuitenkaan ole koneille helppo tehtävä, ja Turingin tätä koskevat ennustukset ovat osoittautuneet liian optimistisiksi. Erilaisten ennusteiden mukaan näyttää siltä, että ensimmäiset testin läpäisyyn pystyvät koneet rakennetaan aikaisintaan 2020.lähde? Tämä edellyttää konetehon eksponentiaalista kasvua vähintään Mooren lain määrittämään tahtiin.

Vuoteen 2007 mennessä yksikään tietokone ei ole läpäissyt Turingin testiä. Yksinkertaiset keskustelusovellukset kuten ELIZA ovat onnistuneet huijaamaan ihmisiä luulemaan keskustelevansa toisen ihmisen kanssa, mutta tällainen saavutus ei ole Turingin testin veroinen. Itsestään selvä ero on siinä, että tällaisten internetissä satunnaisesti käytävien keskustelujen ihmisosapuolella ei ole mitään syytä olettaa puhuvansa muun kuin toisen ihmisen kanssa, kun taas oikeassa Turingin testissä kyselijä yrittää herkeämättä selvittää keskustelukumppaninsa olemuksen. Edellä mainitun kaltaisia keskusteluja, joissa ohjelma eli botti onnistuu matkimisessaan, on yleensä käyty IRCin kaltaisissa ympäristöissä, joissa keskustelu voi usein olla tyhjänpäiväistä eikä sen ymmärtäminenkään ole aivan välttämätöntä. Lisäksi kulloinkin käytettävä keskustelukieli ei useinkaan ole kaikkien käyttäjien äidinkieli, jolloin he saattavat olettaa ohjelman älyttömän kommentin olevan omaa väärinymmärrystään. Tavallinen keskustelija ei yleensä ole tutustunut keskustelubotteihin, eikä tunnista niiden tyypillisiä virheitä.

Vuonna 1991 julistettiin jaettavaksi Loebner-palkinto sovellukselle, joka tuomarien mielestä läpäisee Turingin testin; sitä ei ole vielä jaettu kenellekään. Sen lisäksi jaetaan toinen, vuosittainen palkinto tietokonesovellukselle, joka tuomarien mielestä parhaiten matkii ihmisen käytöstä. Tekoälyn kärkisovelluksista Jabberwacky voitti 2005 ja 2006, A.L.I.C.E. sitä ennen.

Turingin testin läpäiseminen kokonaisuudessaan ei nykyään, 2000-luvun ensimmäisellä vuosikymmenellä, ole kovinkaan suuren akateemisen tai kaupallisen tutkimuksen kiinnostuksen kohteena. Tekoälyyn liittyvien alojen tämänhetkinen tutkimus keskittyy vaatimattomampiin ja rajallisempiin tavoitteisiin.

Nimen alkuperä[muokkaa | muokkaa wikitekstiä]

Turing käytti alkuperäisessä artikkelissaan nimitystä matkimispeli (engl. imitation game) sekä ehdottamalleen testille että miesten ja naisten pelaamalle pelille. Turing kuoli jo 1954, mutta testistä nykyään yksinomaisesti käytetty nimi Turingin testi (engl. Turing test) ilmaantuu käyttöön vasta paljon myöhemmin. Nimen on mahdollisesti keksinyt, ja ainakin tuonut yleiseen käyttöön Arthur C. Clarke klassikoksi muodostuneessa science fiction -romaanissaan 2001 Avaruusseikkailu (1968), jossa sitä käytetään HAL 9000 -tietokoneen yhteydessä.

Kehityskulku[muokkaa | muokkaa wikitekstiä]

Turingin testi sai ensin huomiota lähinnä filosofian tutkijoilta, osittain siksi, että alkuperäinen essee "Computing machinery and intelligence" ilmestyi filosofian aikakauskirjassa Mind. Tieteelliset viittaukset testiin ovat 1960- ja 70-luvuilla filosofisissa artikkeleissa, vasta 1980-luvulta alkaen kiinnostus siihen suureni käytännön tekoälypiireissä.

Erilaisista testille esitetyistä vaihtoehdoista varteenotettavin on ehkä Lovelacen testi, joka perustuu siihen, ettei tarkkailija pysty selittämään tapaa, jolla kone on tulosteensa tuottanut. Turingin testiä kohtaan esitetystä kritiikistä huolimatta se on ensimmäisenä tekoälytestinä säilyttänyt asemansa myös niistä kuuluisimpana.

Muunnelmia[muokkaa | muokkaa wikitekstiä]

Sellainen koe, jossa roolit on vaihdettu esimerkiksi niin, että ihminen matkii konetta, on käänteinen Turingin testi.

Ihmistä matkivan sovelluksen kuulustelu voidaan rajoittaa jollekin tarkalle erikoisalalle. Tällaisessa testissä koneen tulee pystyä matkimaan kyseisen erikoisalan asiantuntijaa vain tämän alan puitteisiin rajatussa keskustelussa.

Eräs muunnelma on ns. "Minimum Intelligent Signal Test", jossa vastaukset ovat pelkästään binäärisiä eli kaksiarvoisia; siis kyllä/ei tai oikein/väärin.

Käänteisen Turingin testin yksi muoto perustuu joidenkin tutkijoiden esittämään ajatukseen mielestä "mielentunnistuslaitteena". Koneen haasteena olisi tässä selvittää, keskusteleeko se ihmisen vai toisen koneen kanssa. Tämä on huomattavasti pitemmälle viety tehtävä kuin se, jota Turing alun perin lähti selvittämään, mutta saattaisi olla riittävä kriteeri selvittämään, ajatteleeko kone samalla tavoin kuin ihminen.

Paitsi alkuperäinen testi, on myös totaalinen Turingin testi science fiction -kirjallisuudessa hyödynnettyä materiaalia. Tunnettu esimerkki on Philip K. Dickin romaani Palkkionmetsästäjä (Do Androids Dream of Elecctric Sheep) (1968), josta on tehty elokuva Blade Runner (1982). Romaanin kuvaamassa läheisessä tulevaisuudessa keinotekoiset ihmisen näköiset replikantit ovat käytännössä erottamattomia ihmisestä.

Kirjallisuutta[muokkaa | muokkaa wikitekstiä]

Katso myös[muokkaa | muokkaa wikitekstiä]

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]