Tiedostomuoto

Wikipediasta
Siirry navigaatioon Siirry hakuun

Tiedostomuoto tai tiedostoformaatti ilmaisee tietokoneiden tallennusmedialle, esimerkiksi kiintolevylle talletetun tiedoston tallennusmuodon eli rakenteen. Monista tiedostomuodoista on olemassa julkinen määritelmä, jossa kuvataan miten tieto tulee koodata. Hyötynä on talletetun tiedon yhteensopivuus eri ohjelmien ja järjestelmien välillä sekä tallennustilan säästö.

Tiedostomuodon merkintä ja tunnistus[muokkaa | muokkaa wikitekstiä]

Tiedostomuodon tunnistamiseen on kehitetty useita eri tapoja. Unix ja Unixin kaltaiset käyttöjärjestelmät tunnistavat tiedostomuodon sen alussa olevasta merkkisarjasta. Esimerkiksi GIF-kuvatiedostot alkavat ASCII-merkeillä GIF87a tai GIF89a standardista riippuen ja käännetty Java-koodi heksaluvuilla 0xCAFEBABE[1]. Amiga OS tunnistaa tiedostot samalla menetelmällä ja esimerkiksi IFF -tiedostot alkavat merkkijonolla FORM. Neljän merkin "Type ID" tunnistetta kutsutaan eri yhteyksissä eri tavoin: Mac OS-alustalla Type ID-koodia kutsutaan OSType:ksi ja Windows-alustalla FourCC:ksi. Uudempi macOS noudattaa BSD:n tavoin Unix-tapaa. Tiedostomuoto voidaan tällöin tunnistaa sen nimeämisestä riippumatta ja esimerkiksi komentoriviputken tai verkon yli välitetyn datavirran yhteydessä tiedostomuoto tunnistetaan ilman nimeä.

Eräs käytetty tapa on käyttää tiedostopäätteitä. Eräät tiedostonhallintaohjelmat kuten Windows Explorer tai Konqueror käyttävät tiedostopäätettä päätelläkseen tiedoston tiedostotyypin. Tiedostopääte on tiedoston nimessä viimeisen pisteen jälkeen tulevat merkit. Esimerkiksi HTML-dokumentit tunnistetaan .html-tiedostopäätteestä. Tiedostopäätteet näkyvät tiedostonimen loppuosassa pisteellä eroteltuna. Esimerkiksi tiedostonimessä foobar.txt, pääteosa .txt voi ilmaista tiedoston olevan yksinkertainen muotoilematon tekstitiedosto, jonka voi avata millä tahansa tekstitiedostoja lukevalla tekstieditorilla tai tekstinkäsittelyohjelmalla.

Eräs tapa ilmaista tiedostomuoto on MIME-tyypit. Ne ovat hallitseva tapa kuvata tiedostomuotoja Internetissä. MIME-muodot koostuvat standardoiduista tunnisteista, jossa tyyppi ja alatyyppi erotetaan vinoviivalla: esimerkiksi text/html tai image/gif. MIME-tyypit oli tarkoitettu alun perin kuvaamaan sähköpostin liitetiedostojen tiedostomuotoja alustariippumattomasti. Sama tekniikka on otettu WWW:n HTTP-tiedostosiirtoprotokollan käyttöön.

Tekniikka[muokkaa | muokkaa wikitekstiä]

Tiedostomuoto tarkoittaa välttämättömien valinnaisten tietojen säilömistä rakenteeseen, joka voidaan ohjelmallisesti käsitellä yhdessä tai useammassa eri ohjelmassa. Välttämättömiä tietoja voivat olla audiokanavien lukumäärä ja näytteenottotaajuus äänen oikean toiston varmistamiseksi. Valinnaisia tietoja voivat olla tekijän ja tiedoston luomiseen käytetyn ohjelman nimi sekä ajan hetki.

Esimerkiksi AIFF-tiedostomuoto koostuu lohkoista, joissa kerrotaan tietynlaisia metatietoja itse audiodatasta. Metatiedot kertovat montako bittiä yksittäinen ääninäyte on ja ohjelma sen mukaan voi jakaa datan eri kanaviin.[2] Käsittelevä ohjelma voi myös ohittaa lohkot joita se ei välttämättä tarvitse sillä hetkellä.

Säännönmukainen tiedostomuoto voi olla olennaista, jotta tietoa voidaan käsitellä luotettavasti eri ohjelmaversioiden ja eri ohjelmien välillä, osittain koska uudemmat versiot voivat lisätä tietoa jota aiemmat versiot eivät osaa käsitellä.

Tiedostomuotoja[muokkaa | muokkaa wikitekstiä]

Tiedostomuotoja on olemassa useita eri tarkoituksiin. Joihinkin tarkoituksiin on jopa useita kilpailevia muotoja. Osa tiedostomuodoista on suunniteltu vain yhtä tarkoitusta varten, kuten JPEG staattisten kuvien tallennusta varten. Osaa tiedostomuodoista voidaan käyttää useaan tarkoitukseen, kuten GIF-tiedostomuoto, jota voidaan käyttää kuvien ja animaatioiden tallentamiseen. Tiedostomuodot voidaan jakaa käyttötarkoituksensa perusteella seuraavasti:

Arkistotiedostomuodot[muokkaa | muokkaa wikitekstiä]

Arkistotiedostomuodot ("pakkausohjelmien" tiedostot) tiivistävät alkuperäisiä tiedostoja ja arkistoimalla säästetään muistitilaa tai pystytään siirtämään tiedostoja verkostossa vähäisemmällä määrällä tietoliikennettä.

  • RAR
  • ZIP
  • LHA
  • LZX
  • sit (Stuffit Expander)
  • xar/xip

Unixeissa käytetty tar-ohjelma ei itsessään pakkaa, mutta tukee ulkoisia pakkausohjelmia, kuten gzip, bzip2 ja xz, pakkaamiseen ja purkamiseen.

Pakettitiedostomuodot[muokkaa | muokkaa wikitekstiä]

Ohjelmien asennukseen käytettävät pakettitiedostomuodot kuten:

Kuvatiedostomuodot[muokkaa | muokkaa wikitekstiä]

Kuvatiedostomuotoja käytetään kuvien tallentamiseen, säilyttämiseen ja katseluun. Kuvat voidaan jakaa bittisyvyytensä mukaan määrittyviin värisyvyyksiin.

Ohjelmatiedostomuodot[muokkaa | muokkaa wikitekstiä]

Pääartikkeli: Ohjelmatiedosto

Ohjelmatiedostomuotoja käytetään konekielisten ohjelmien tiedoille sekä objektitiedostoille.

Teksti- ja dokumenttitiedostomuodot[muokkaa | muokkaa wikitekstiä]

Tekstitiedostomuotoja käytetään tekstien tallentamiseen ja esittämiseen. Dokumenttitiedostot voivat sisältää myös kuvia ja grafiikkaa sekä muotoilumäärittelyjä.

  • tekstitiedosto, (toisinaan lyhennetty TXT), useita merkistöstä riippuvia muotoja
  • Rich Text Format, "rikastettu" tekstitiedosto
  • DOC, useita samaa nimeä käyttäviä tiedostomuotoja, mukaan lukien Microsoft Wordin käyttämä tiedostomuoto
  • PostScript, sivunkuvauskieli ja dokumenttimuoto
  • PDF, Adoben dokumenttimuoto
  • EPUB, sähkökirjoissa käytetty muoto
  • DjVu, skannatuille tiedoille suunnattu dokumenttimuoto
  • DVI, TeX-ohjelmiston muoto

Videotiedostot[muokkaa | muokkaa wikitekstiä]

Yleisimmät videotiedostot ovat säiliömuotoja, jotka eivät pakota mitään tiettyä koodekkia videolle tai äänelle vaan voivat sisältää eri tavalla koodattua dataa.

Äänitiedostomuodot[muokkaa | muokkaa wikitekstiä]

Ääninäytteet
wav-muodossa oleva äänitallenne. 2.1 Megatavua
ogg-muodossa oleva äänitallenne: 154 kilotavua.

Äänitiedostojen kuunteluohjeet

  • AIFF, Applen suunnittelema tiedostomuoto, ei pakkausta (AIFF-C on pakkauksen sisältävä muoto)
  • WAV tai WAVE, Microsoftin suunnittelema tiedostomuoto, ei pakkausta
  • AU, Sun Microsystemsin suunnittelema tiedostomuoto, eri koodausmenetelmiä
  • FLAC, vapaa standardi, häviötön pakkaus
  • AAC, häviöllinen pakkaus, lisenssirajoitukset (patentit voimassa)
  • MP3, häviöllinen pakkaus, lisenssirajoitukset (patentit vanhentuneet)
  • Ogg, vapaa standardi, häviöllinen pakkaus
  • MIDI, soitinäänet tallentava tiedostomuoto

Katso myös[muokkaa | muokkaa wikitekstiä]

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. JSR-000202 JavaTM Class File Specification Update Evaluation 1.0 Final Release
  2. Audio Interchange File Format (AIFF) muratnkonar.com. Arkistoitu 18.4.2017. Viitattu 28.11.2017.

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]

Commons
Commons
Wikimedia Commonsissa on kuvia tai muita tiedostoja aiheesta Tiedostomuoto.