Puheteknologian historia

Kohteesta Wikipedia
Siirry navigaatioon Siirry hakuun

Puheteknologian historiaa[muokkaa | muokkaa wikitekstiä]

Puheteknologian historiaa Suomessa[muokkaa | muokkaa wikitekstiä]

Puheteknologian historia Suomessa alkaa 1970-luvulta jolloin Yhdysvalloissa kehitettiin yleiskäyttöiset mikroprosessorit[1].

SYNTE 2[muokkaa | muokkaa wikitekstiä]

Ensimmäinen suomalainen puheteknologiakeksintö oli maailman ensimmäinen kannettava mikroprosessoripohjainen sääntösynteesillä varustettu formanttipuhesyntetisaattori SYNTE 2. Se saatiin Euroka Oy:ssä tuotantoon jo 1970-luvun puolella[1][2].

VOCOM Ky[muokkaa | muokkaa wikitekstiä]

VOCOM ky oli ensimmäinen suomalaisen digitaalisen signaalinkäsittelyn ja puheteknologian yritys. Se toimi vuodesta 1980 vuoteen 2003 ja aluksi TTKK:n elektroniikan laitoksen tiloissa. VOCOM ky:n tärkein tuote oli SPS2-puheanalyysijärjestelmä.[1].

SPS2-puheanalysaattori[muokkaa | muokkaa wikitekstiä]

Syksyllä 1980 ilmestyi käyttöön mikroprosessoripohjainen SPS2-puheanalysaattori. Se oli Vocom ky:n tuotantoa[1]. SPS2 kehitettiin pohjautuen Motorolan Exorset30-mikrotietokoneeseen, jossa oli 8/16-bittinen M6809-mikroprosessori. SPS2 sisälsi yrityksen kehittämän muunninkortin, laskossuodinkortin ja mikrofonivahvistimen. Käytettävissä oli taajuusalue 20 Hz – 5000 Hz ja 12 bitin dynamiikka. SPS2-puheanalyysiohjelmisto sisälsi FFT-spektrin, LPC-spektrin, auditorisen spektrin ja signaalinäytön sekä tulostuksen kuvaruudulle ja piirturille. Ohjelmisto oli kirjoitettu BASIC-kielellä ja apuna käytettiin konekielellä koodattuja analyysirutiineja analyysien nopeuttamiseksi. SPS2 oli ensimmäinen Suomessa ja Tampereella kehitetty mikroprosessoripohjainen puheanalysaattori. SPS2:n kehitti TTKK:n silloinen yliassistentti tekniikan tohtori Matti A. Karjalainen 1980[1].

SANA1-puheentunnistin[muokkaa | muokkaa wikitekstiä]

Vuosina 19791980 Matti A. Karjalainen kehitti TTKK:n elektroniikan laitoksella mikroprosessoripohjaista SANA1-puheentunnistinta SPS2:n pohjalta [3].

Korkean tason SPL1-puhesynteesikieli[muokkaa | muokkaa wikitekstiä]

1981 Raimo O. Toivonen ryhtyi TTKK:n elektroniikan laitoksella ja omassa insinööritoimistossaan kehittämään korkean tason puhesynteesikieltä ja sen kääntäjää Motorolan EXorset30-ympäristöön. Kääntäjä toteutettiin 19811983 M6809-mikroprosessorin assemblykielellä. Alkuperäinen tavoite oli luoda sen aikaiseen Motorolan kehitysympäristöön konekieltä sopivampi tapa kirjoittaa SYNTE-formanttipuhesyntetisaattoreille puhesynteesiohjelmia. Ajatus uuden ohjelmointikielen luomisesta syntyi professori Yrjö Neuvon 19761978 jatko-opintokursseilla TTKK:n elektroniikan laitoksella. Käännös oli kaksivaiheinen. SPL1-kääntäjä käänsi ensin M6809:n symboliselle assemblykielelle ja Motorolan assemblerkääntäjä käänsi ohjelman sitten M6809:n konekoodiksi. SPL1-kieli sisälsi puhesynteesiä varten ilmaisuja, joita ei löytynyt muista sen aikaisista M6809:n ohjelmointikielistä. Tärkein tällä kielellä ohjelmoitu tuote oli SPL1-tutkimuspuhesyntetisaattori akateemiseen tutkimuskäyttöön.

SPL1-tutkimuspuhesyntetisaattori[muokkaa | muokkaa wikitekstiä]

Tammikuussa 1983 ilmestyi mikroprosessoripohjainen SPL1-tutkimuspuhesyntetisaattori akateemiseen käyttöön. Se oli Ins.tsto Raimo Toivosen tuotantoa[1]. Kirjallisuutta kohdassa on opinnäytteitä, joissa on SPL1-tutkimuspuhesyntetisaattorin käyttöä.

Computer Voice Fields™ -analyysiohjelma ja F0/A0-analyysiohjelma™ foniatriseen käyttöön[muokkaa | muokkaa wikitekstiä]

Joulukuussa 1984 ilmestyi Computer Voice Fields™ -analyysiohjelma ja F0/A0-analyysiohjelma™ foniatriseen käyttöön. Ne toimitettiin ensimmäiseksi Kinkomaan sairaalan foniatrian poliklinikalle Jyväskylään 20.12.1984. Ne olivat Ins.tsto Raimo Toivosen tuotantoa[1] ja toimivat Vocom ky:n SPS2-puheanalysaattorin yhteydessä. Äänikenttäkuvat ja F0/A0-kuvat tulostettiin piirturilla paperille. Ihmisäänen perustaajuuden F0 ilmaisevaa algoritmia ja F0/A0-analyysiohjelmaa Raimo O. Toivonen on kehittänyt Tampereella vuodesta 1982 lähtien. Algoritmi edelleen käytössä Intelligent Speech Analyser™ (ISA) -puheanalyysiohjelmassa. Aluksi Computer Voice Fields™ oli ei-reaaliaikainen, mutta jonkin ajan kuluttua siihen lisättiin 16-bittistä NEC uPD7720 -signaaliprosessoria käyttävä reaaliaikainen Computer Voice Fields™ -kortti ja Computer Voice Fields™ -analyysiohjelma. Computer Voice Fields of Connected Speech, Symposium on Voice Disorders on maailman ensimmäisen mikroprosessoripohjaisen Computer Voice Fields™ -puheanalyysimenetelmän kansainvälinen julkaisu 1985[4]. Kirjallisuutta kohdassa on julkaisuja, joissa on Computer Voice Fields™:in käyttöä.

F0/A0-analyysiohjelma™ foneettiseen käyttöön[muokkaa | muokkaa wikitekstiä]

Lokakuussa 1985 ilmestyi ei-reaaliaikainen F0/A0-analyysiohjelma™ foneettiseen käyttöön. Se toimitettiin ensimmäiseksi Helsingin yliopiston fonetiikan laitokselle 7.10.1985. Se toimi Vocom ky:n SPS2-puheanalysaattorin yhteydessä. F0/A0-kuvat tulostettiin piirturilla paperille. Se oli Ins.tsto Raimo Toivosen tuotantoa[1].

Intelligent Speech Analyser™ (ISA) -puheanalysaattori[muokkaa | muokkaa wikitekstiä]

Joulukuussa 1986 ilmestyi käyttöön signaalitietokonepohjainen Intelligent Speech Analyser™ (ISA) -puheanalysaattori. Tässä omalla signaalimuistilla varustetussa signaalitietokoneessa käytettiin Texasin TMS32010-signaaliprosessoria. Myöhemmin se muuttui tietokoneohjelmaksi. Se on Pitchsystems Oy:n tuotantoa[1].

Katso myös[muokkaa | muokkaa wikitekstiä]

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. a b c d e f g h i Tieto löytyy Intelligent Speech Analyser™ (ISA):n kotisivulta
  2. Karjalainen, Matti: An approach to hierarchical information processes with the application to speech synthesis by rule. Tampere University of Technology, 20.10.1978. ISBN 951-666-105-X.
  3. Karjalainen, Matti: SANA1 – Puheentunnistin suomen kielelle. Fonetiikan päivät – Oulu 1979. IX Fonetiikan päivillä Oulun yliopistossa 7.–8.9.1979 pidetyt esitelmät, s. 91–100, 1980. ISBN 951-42-0798-X.
  4. Sonninen, Aatto & Pertti, Hurme & Toivonen, Raimo: Computer Voice Fields of Connected Speech. Sweden: Symposium on Voice Disorders, August 23 1985.

Kirjallisuutta[muokkaa | muokkaa wikitekstiä]

  • SYNTE 3:n kuvia 1980-luvulta: [1], [2]
  • Kauppa- ja teollisuusministeriön Puhestulostin-projektin raporttisivuja: [3], [4]
  • Karjalainen, Matti & Laine, Unto: Speech Research and Technology in USA, s. 1–58. Report of a visit to USA, April 1980. Application Report 5/1980. Tampere University of Technology Electronics Laboratory, 1980. ISBN 951-720-516-3.

Väitöskirja SYNTE 2:n kehittämisestä

  • Karjalainen, Matti: An approach to hierarchical information processes with the application to speech synthesis by rule. Tampere University of Technology, 20.10.1978. ISBN 951-666-105-X.

Opinnäytteitä SPL1-tutkimuspuhesyntetisaattoria käyttäen

  • Ensimmäinen opinnäyte: Nieminen, Anna-Liisa: Suomen intonaation identifiointi ja diskriminointi. Akateeminen pro gradu tutkielma. HY:n fonetiikan laitos, 1983.
  • Ensimmäinen sivulaudaturtyö: Nieminen, Anna-Liisa: Suomen yksisanaisten myöntövastausten intonaatiosta. Akateeminen sivulaudaturtyö. Helsingin yliopiston suomen kielen laitos, 1984.
  • Ensimmäinen lisensiaattityö: Nieminen, Anna-Liisa: Suomen yksisanalausumien intonaatiosta – havaintokokeita synteettisellä puheella. Akateeminen lisensiaattityö. HY:n fonetiikan laitos, 1985.
  • Toinen lisensiaattityö: Aulanko, Reijo: Puheen havaitsemisen psykofysiologisista perusteista: formanttitransitioiden havaitseminen. Akateeminen lisensiaattityö. HY:n fonetiikan laitos, 1989.

Julkaisuja SPL1-tutkimuspuhesyntetisaattoria käyttäen

  • Sovijärvi, Antti & Aulanko, Reijo: Suomen lauseintonaation eräistä piirteistä. Fonetiikan päivät – Espoo 1988, Papers from the 15th Meeting of Finnish Phoneticians, (Karjalainen M., Laine Unto, toim.). Julkaisu 31, s. 247–259. Espoo: TKK:n akustiikan laboratorio, 1988. ISBN 951-679-741-5.
  • Sovijärvi, Antti & Aulanko, Reijo: Abstract: Some Aspects of Finnish Sentence Intonation. Espoo: Helsinki University of Technology, Acoustics Laboratory, 1988. ISBN 951-754-741-2.
  • Sovijärvi, Antti & Aulanko, Reijo: Synthesis of Certain Speech Sounds and Sentence Intonation of Hungarian, Finnish, and Finland-Svedish. Commentations humanarum Litterarum, Vol. 101. Societes Scientiarum Fennica, The finnish Society of Sciences and Letters, 1994. ISBN 951-653-271-3.

Julkaisuja Computer Voice Fields™:iä käyttäen

  • Ensimmäinen julkaisu: Sonninen, Aatto & Hurme, Pertti & Toivonen, Raimo: Computer Voice Fields of Connected Speech. Sweden: Symposium on Voice Disorders, August 23 1985.
  • Sonninen, Aatto & Hurme, Pertti & Toivonen, Raimo: Computer Voice Fields of Connected Speech, s. 93–111. Papers in Speech Research, 6,. Jyväskylän yliopisto, 1985.
  • Vilkman, Erkki & Sonninen, Aatto & Hurme, Pertti: Observations on Voice Production by Means of Computer Voice Fields, s. 370–371. Tokyo: In: Logopedics and Phoniatrics. Issues for Future Research. Proceedings of the XXth Congress of the International Association Logopedics and Phoniatrics, August 3–7 1986.
  • Jaroma, Marjatta & Sonninen, Aatto & Hurme, Pertti & Toivonen, Raimo: Computer Voice Field Observations of Menopausal Dysphonia. Vienna: Paper presented at the 13th Congress of the European Union of Phoniatricians, November 5–9.1986.
  • Aaltonen, Olli & Raimo, Ilkka & Vilkman, Erkki: Äänen korkeuden säätelyyn vaikuttavien mekanismien tutkimisesta, s. 7–31. XIII Fonetiikan päivät – Turku 1985 (toim. Aaltonen O. & Hulkko T.) Suomalaisen ja yleisen kielitieteen laitoksen julkaisuja 26. Turku: Turun yliopisto, 1985. ISBN 951-642-751-0.
  • Sonninen, Aatto & Hurme, Pertti & Vilkman, Erkki: Observations of voice production by means of Computer Voice Fields. Folia Phoniatrica 1986;38:366.
  • Sonninen, Aatto: Ihmisäänen rekistereistä, s. 4–21. Laulupedagogi 1989–1990. Laulupedagogit ryn vuosijulkaisu. Helsinki: Yliopistopaino, 1990.
  • Vilkman, Erkki: An Apparatus for Studying the Role of the Cricothyroid Articulation in the Voice Production of Excited Human Larynges. Folia Phoniatrica 1987;39:169–177.
  • Vilkman, Erkki: Studies on human voice production. Acta Universitatis Tamperensis ser A vol 232, 1987.

Julkaisuja SPS2-puhenalysaattoria käyttäen

  • Iivonen, Antti: Eräistä vokaalien akustiikan ja havaitsemisen välisistä suhteista, s. 85–127. XIII Fonetiikan päivät – Turku 1985 (toim. Aaltonen O. & Hulkko T.) Suomalaisen ja yleisen kielitieteen laitoksen julkaisuja, 26. Turun yliopisto, 1985. ISBN 951-642-751-0.
  • Iivonen, Antti & Nieminen, Anna-Liisa: Puhujantunnistus fonetiikan juridisena sovelluksena. Fonetiikan laitoksen monisteita, 11. Helsingin yliopisto, tammikuu 1986. ISBN 951-45-3879-X.

Yleistä

  • Iivonen, Antti: Reaaliaikainen spektrianalyysi foneettisissa sovellutuksissa. Fonetiikan laitoksen monisteita, 8. Turun yliopisto, huhtikuu 1978. ISBN 951-42-0583-9.
  • Fant, Gunnar: Acoustic Theory of Speech Production. Mouton De Gruyter, The Hague, 1970. ISBN 90-279-1600-4.

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]