Whisper

Wikipediasta
Siirry navigaatioon Siirry hakuun
Whisper
Kehittäjä OpenAI
Kehityshistoria
Ensijulkaisu 21. syyskuuta 2022
Tiedot
Ohjelmistotyyppi käännössovellus
Alusta OpenAI
Lisenssi MIT-lisenssi
Aiheesta muualla
Verkkosivusto

Whisper on OpenAI:n kehittämä automaattinen puheentunnistusjärjestelmä. Whisper on julkaistu lokakuussa 2022. Järjestelmä voi tuottaa tekstiä äänisyötteistä. Whisper on kehitetty 680 000 tunnin monikielisellä verkkoaineistolla. Whisper mahdollistaa käännösversiot 99 kielelle sekä kääntämisen englanniksi.[1][2]

Ominaisuudet[muokkaa | muokkaa wikitekstiä]

Whisperin merkittävin ominaisuus on sen kestävyydessä. Monipuolisen harjoitusaineiston avulla järjestelmä pystyy ymmärtämään ja siirtämään puhetta eri aksenttien välillä. Whisper toimii myös meluisassa ympäristössä. Whisper kykenee kääntämään puhetta useilla eri kielillä. Whisper on toteutettu enkooderi-dekooderi-muuntajana ja se käsittelee syötettyä ääntä 30 sekunnin mittaisina kokonaisuuksina.[3]

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. Introducing Whisper OpenAI. 21.9.2022. Viitattu 18.2.2024. (englanniksi)
  2. Cochard, David: Whisper : Speech Recognition Model Capable of Recognizing 99 Languages Medium. 13.11.2023. Viitattu 18.2.2024. (englanniksi)
  3. Kumar, Akhil: Whisper: A Breakthrough in Automatic Speech Recognition Medium. 10.10.2023. Viitattu 18.2.2024. (englanniksi)