Tiedostomuoto

Kohteesta Wikipedia
Loikkaa: valikkoon, hakuun

Tiedostomuoto ilmaisee tietokoneiden tallennusmedialle talletetun tiedoston tallennusmuodon eli rakenteen. Monista tiedostomuodoista on olemassa julkinen määritelmä, jossa kuvataan miten tieto tulee koodata. Hyötynä on talletetun tiedon yhteensopivuus eri ohjelmien ja järjestelmien välillä.

Tiedostomuodon merkintä ja tunnistus[muokkaa | muokkaa wikitekstiä]

Tiedostomuodon tunnistamiseen on kehitetty useita eri tapoja. Eräs yleisesti käytetty tapa on käyttää tiedostopäätteitä. Tiedostonhallintaohjelmat, kuten esimerkiksi Windows-käyttöjärjestelmä tai KDE:n tiedostoselain Konqueror käyttävät tiedostopäätettä päätelläkseen tiedoston tiedostotyypin, mikä on jokaiselle tiedostomuodolle määritelty. Tiedostopääte on tiedoston nimessä viimeisen pisteen jälkeen tulevat merkit. Esimerkiksi HTML-dokumentit tunnistetaan .html-tiedostopäätteestä. Muita tiedostomuodon tunnistamiseen käytettäviä tapoja on muun muassa tiedostomuodon päättely tiedoston sisällön perusteella ja metadatan tallentaminen tiedostojärjestelmään.

Tiedostopäätteet näkyvät tiedostonimen loppuosassa pisteellä eroteltuna. Esimerkiksi tiedostonimessä foobar.txt, osa .txt ilmaisee tiedoston olevan yksinkertainen, muotoilematon tekstitiedosto, jonka voi avata millä tahansa tekstitiedostoja lukevalla tekstieditorilla tai tekstinkäsittelyohjelmalla, esimerkiksi Windowsin Muistiolla tai AbiWordilla. Mikäli tiedoston nimi olisi foobar.rtf, se tarkoittaisi että tiedosto on muodossa Rich Text Format, joka on tietyntyyppinen muotoiluja sisältävä tekstitiedosto, joka voi sisältää tekstin lisäksi yleisiä tekstimuotoiluja kuten esimerkiksi lihavointia tai otsikoita. Jos tiedoston nimi on foobar.doc, se on luultavasti Microsoft Wordin käyttämä muotoiltu tekstitiedosto, jonka osaavat avata myös monet muut nykyaikaiset tekstinkäsittelyohjelmat. Tässä tulee kuitenkin esiin tiedostopäätteisiin perustuvan tiedostomuodon päättelyn ongelma. .doc on melko yleinen pääte (englannin sanasta document, dokumentti), jota on käytetty yleisesti jo ennen kuin Microsoft otti sen Word-tekstinkäsittelyohjelman käyttöön. Jotkut .doc-päätteiset tiedostot voivat olla tavallisia muotoilemattomia tekstitiedostoja.

Jossain tapauksissa käsiteltävällä datalla ei ole tiedostonimeä, josta päättely voitaisiin tehdä. Näin voi tapahtua esimerkiksi ladattaessa tiedostoa verkosta.

Toinen tapa ilmaista tiedostomuoto on MIME-tyypit. Ne ovat hallitseva tapa kuvata tiedostomuotoja Internetissä. MIME-muodot koostuvat standardoiduista tunnisteista, jossa tyyppi ja alatyyppi erotetaan vinoviivalla – esimerkiksi text/html tai image/gif. MIME-tyypit oli tarkoitettu alun perin kuvaamaan sähköpostin liitetiedostojen tiedostomuotoja alustariippumattomasti. Sama tekniikka on otettu WWW:n HTTP-tiedostosiirtoprotokollan käyttöön.

Erityisesti UNIX-järjestelmiin ja sen jälkeläisiin yhdistetty tapa on aloittaa tiedosto jollain binäärisarjalla. Esimerkiksi GIF-kuvatiedostot alkavat ASCII-merkeillä GIF87a tai GIF89a standardista riippuen ja käännetty Java-koodi heksaluvuilla 0xCAFEBABE[1]. Tämä tapa ei kuitenkaan ole kätevä, jos pitää selvittää usean tiedoston tiedostomuoto, koska jokaisesta tiedostosta pitää lukea alku ja arvata siitä sen tyyppi.

Myös muita tapoja kertoa tiedoston tiedostomuoto löytyy esimerkiksi Mac OS -käyttöjärjestelmästä.

Tiedostomuotoja[muokkaa | muokkaa wikitekstiä]

Tiedostomuotoja on olemassa useita eri tarkoituksiin. Joihinkin tarkoituksiin on jopa useita kilpailevia muotoja. Osa tiedostomuodoista on suunniteltu vain yhtä tarkoitusta varten, kuten JPEG staattisten kuvien tallennusta varten. Osaa tiedostomuodoista voidaan käyttää useaan tarkoitukseen, kuten GIF-tiedostomuoto jota voidaan käyttää kuvien ja animaatioiden tallentamiseen. Tiedostomuodot voidaan jakaa käyttötarkoituksensa perusteella seuraavasti:

Arkistotiedostomuodot[muokkaa | muokkaa wikitekstiä]

Arkistotiedostomuodot tiivistävät alkuperäisiä tiedostoja ja arkistoimalla säästetään muistitilaa tai pystytään siirtämään tiedostoja verkostossa vähäisemmällä määrällä tietoliikennettä.

Kuvatiedostomuodot[muokkaa | muokkaa wikitekstiä]

Kuvatiedostomuotoja käytetään kuvien tallentamiseen, säilyttämiseen ja katseluun. Kuvat voidaan jakaa bittisyvyytensä mukaan määrittyviin värisyvyyksiin.

  • BMP, kehittäjä Microsoft Windows bitmap, pakkaamaton tiedostomuoto
  • GIF, kehittäjä/patentin haltija Unisys/IBM
  • JPEG, kehittäjä Joint Photographic Experts Group [1]
  • PNG, vapaa W3C-standardi, uusi versio ISO/IEC 15948:2003
  • RAW-tiedostomuodot ovat digitaalikameroiden muokkaamattomien raakakuvien tiedostomuotoja, mitkä digitaalikamera tallentaa sellaisenaan käsittelemättöminä.
  • SVG, Vektorigrafiikan tiedostomuoto
  • TIFF, Sivuntaitto-ohjelmien tiedostomuoto

Tekstitiedostomuodot[muokkaa | muokkaa wikitekstiä]

Tekstitiedostomuodot, mitä käytetään tekstien tallentamiseen ja esittämiseen yksinkertaisimmasta ja varhaisimmasta monipuolisimpaan lueteltuna.

  • TXT, tekstimerkkitiedosto
  • RTF, rikastettu tekstimerkkitiedosto
  • DOC, Microsoft Wordin tiedostomuoto, käytetään myös monissa muissa tekstinkäsittelyohjelmissa

Videotiedostot[muokkaa | muokkaa wikitekstiä]

Yleisimmät videotiedostot ovat säiliömuotoja, jotka eivät pakota mitään tiettyä koodekkia videolle tai äänelle vaan voivat sisältää eri tavalla koodattua dataa.

Äänitiedostomuodot[muokkaa | muokkaa wikitekstiä]

  • WAV, Microsoftin tiedostomuoto, yleensä häviötön pakkaus
  • FLAC, vapaa standardi, häviötön pakkaus
  • MP3, häviöllinen pakkaus
  • Ogg, vapaa standardi, Häviöllinen pakkaus
  • AAC, häviöllinen pakkaus
  • MIDI, soitinäänet tallentava tiedostomuoto

Katso myös[muokkaa | muokkaa wikitekstiä]

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. JSR-000202 JavaTM Class File Specification Update Evaluation 1.0 Final Release

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]