HTML
Wikipedia
HTML (lyhenne sanoista Hypertext Markup Language) on avoimesti standardoitu kuvauskieli, jolla voidaan kuvata hyperlinkkejä sisältävää tekstiä eli hypertekstiä. HTML tunnetaan erityisesti kielenä, josta webbisivut rakentuvat.
HTML:lla voidaan myös merkitä tekstin rakenne eli esimerkiksi mikä osa tekstistä on otsikkoa ja mikä leipätekstiä. Merkintä tehdään tekstin sekaan kirjoitettavilla elementeillä ja elementeissä olevilla määritteillä.
HTML5:ttä edeltävien HTML-versioiden syntaksi on määritelty SGML:n sovelluksina. HTML 4.01:stä on myös XML:n sovellukseksi muotoiltu versio XHTML 1.0 ja HTML5:stä on rinnakkainen XML-versio XHTML5.
Sisällysluettelo |
[muokkaa] Historia
HTML:n historia alkoi vuonna 1989, kun Tim Berners-Lee ja Robert Caillau hahmottelivat korviketta CERNin dokumenttien kirjavalle formaatille. Rinnalle suunniteltiin yksinkertainen verkkoprotokolla HTTP. HTML-dokumenttien verkkoa internetissä kutsutaan World Wide Webiksi eli lyhyesti webiksi. Joillekin se on yhtä kuin Internet. CERN käynnisti oman WWW-palvelimensa vuonna 1991, ja monet ideasta kiinnostuneet liittyivät siihen nopeasti. HTML-standardia ylläpitää vuonna 1994 perustettu kansainvälinen yritysten ja yhteisöjen yhteenliittymä W3C (World Wide Web Consortium).
HTML:n alkuperäinen tarkoitus oli pikemminkin kuvata WWW-sivun rakennetta kuin sen ulkoasua, mutta sivujen kirjoittajat halusivat ennen pitkää paremmat mahdollisuudet vaikuttaa myös dokumenttiensa ulkoasuun. Selainvalmistajat vastasivat tarpeeseen esittelemällä HTML-määritykseen kuulumattomia elementtejä, joilla esitystapaa saattoi kuvailla. Monet näistä elementeistä jouduttiin myöhemmin ottamaan mukaan viralliseen HTML-määritykseen käytännön standardeina. Nykyisin monia elementtejä jälleen puuttuu itse HTML:sta, sillä ulkoasun kuvailussa on siirrytty erillisiin tyyliohjeisiin, jotka kuvataan CSS-kielellä. CSS:ään siirtyminen paitsi yksinkertaisti HTML:ää, myös helpotti sivujen luomista ja päivittämistä.
[muokkaa] Standardointi
Berners-Lee julkaisi ensimmäisen kuvauksen HTML:sta Internetissä vuoden 1991 lopulla.[1] Siinä oli 22 tagia, joista 13 on edelleen käytössä HTML 4:ssä. Berners-Lee suunnitteli HTML:n SGML:n sovellukseksi, mutta vasta IETF toteutti määrittelyn sen avulla vuonna 1993. IETF:n määrittely oli vedos, joka raukesi kuuden kuukauden päästä. Se sisälsi NCSA Mosaicin tukeman kuvien lisäyksen dokumentteihin. Dave Raggett julkaisi kilpailevan HTML+:n, joka sisälsi myös jo käytössä olleet taulukot ja lomakekentät.
Alkuvuodesta 1994 IETF muodosti HTML-työryhmän, joka laati "HTML 2.0" -määritelmän, joka julkaistiin RFC 1866:na 1996. Siihen tehtiin joitain lisäyksiä, kuten tiedoston tallennus palvelimelle, RFC 1867; taulukot, RFC 1942; kuvakartat, RFC 1980; merkistömäärittelyt ja LANG-attribuutti, RFC 2070.
IETF julkaisi huhtikuussa 1995 myös standardiehdotuksen HTML 3.0:sta, mutta sekin raukeni viiden kuukauden kuluttua ilman toimenpiteitä. Tämä standardiehdotus sisälsi monia Raggettin HTML+:n ominaisuuksista, kuten matemaattisten kaavojen sisällyttämisen dokumenttiin, taulukot ja tekstin sijoittelun kuvien ympärille. Ainoa selain joka osasi HTML 3.0:aa oli W3C:n Arena.
IETF:n työryhmän toiminta hiipui ja se lakkautettiin syyskuussa 1997. Pitkään HTML:n kehitys oli selainvalmistajien, lähinnä Netscapen ja Microsoftin varassa, jotka määrittelivät omia koodejaan.
Standardointityö jatkui kun W3C julkaisi HTML 3.2:n tammikuussa 1997.[2]. Siitä jätettiin kokonaan pois matematiikan tuki ja siihen lisättiin pääosa Netscapen määrittelemistä sivun ulkomuotoa kuvaavista koodeista.
Loppuvuodesta 1997 julkaistiin HTML 4.0. Siinä on kolme tasoa, jotka määrittelevät "tiukan" HTML:n, josta on poistettu suurin osa vanhentuneista tageista, "siirtymäajan", jossa nämä on sallittu, sekä muodon, jossa Netscape 2.0:ssa esitellyt kehykset, eli sivun jakaminen useisiin sivuihin on sallittu.
HTML 4:aa päivitettiin huhtikuussa 1998 ja joulukuussa 1999 HTML 4.01:ksi. Siitä julkaistiin myös toukokuussa 2000 tiukkaan standardiin perustuva ISO-standardi ISO/IEC 15445:2000. HTML 4.01 määriteltiin myös XML:n avulla, jolloin syntyi XHTML.
Ensimmäinen version HTML 5:n vedoksesta julkaistiin tammikuussa 2008.[3] HTML 5:n uusia ominaisuuksia ovat mm. CANVAS- ja VIDEO-elementit, joiden avulla sivulle voidaan sijoittaa piirtoalue ja videopätkä.
[muokkaa] Merkintä
HTML-kuvauskieli on kärkisukeis-merkeillä erotettua, avainsanoihin perustuvaa tekstiä (malli: <avainsana>). Peruskomennoissa yleensä sama avainsana aloittaa, sekä kautta-merkillä aloitettuna (malli: </avainsana>), lopettaa lauseen. Esimerkiksi lihavointi saadaan avainsanalla b, merkkijono <b>lihavoidut sanat</b> tuottaa tekstin lihavoidut sanat. Erikoismerkit ja koodit alkavat &-merkillä (et eli ampersandi) ja loppuvat puolipisteeseen, esimerkiksi sitova välilyönti saadaan koodilla . Useammat välilyönnit korvautuvat yhdellä välilyönnillä ja rivinvaihdot eivät tarkoita mitään vaan on tuotettava omalla komennollaan.
HTML-dokumentteja voi kirjoittaa millä tahansa tekstieditorilla, mutta tehtävään on tarjolla myös erityisiä HTML-editoreja. Periaatteessa HTML-koodin tulisi aina läpäistä validointi, mutta käytännössä monet selaimet hyväksyvät myös dokumentteja, joiden HTML-koodi ei ole standardin mukaista. Perinteisesti HTML:n validointi on ollut sikäli työlästä, että sen jäsentäminen ei ole aivan triviaalia. HTML:n seuraaja XHTML onkin vain eräs alijoukko säännönmukaisemmasta XML-kielestä, ja siihen on olemassa ennestään huomattava joukko hyviä jäsentimiä ja validaattoreita. XHTML:ää voi siten myös kirjoittaa helposti millä hyvänsä XML-editorilla.
[muokkaa] Elementit
Elementit ovat HTML-merkkauskielen perusrakenne. Elementeissä on kaksi perusominaisuutta: attribuutit ja sisältö. Kullakin attribuutilla ja kullakin elementin sisällöllä on selviä rajotteita ollakseen kelvollisia HTML-dokumenteille. Elementillä on tavallisesti aloitustunniste (s.o. <elementin-nimi>) ja lopetustunniste (s.o. </elementin-nimi>. Elementtien atribuutit sijaitsevat aloitustunnisteessa (s.o. <elementin-nimi attribuutti="arvo">Sisältö</elementin-nimi>). Joillakin elementeillä, kuten <br>, ei ole yhtään sisältöä ja niillä ei tarvitse olla lopetustunnistetta (xhtml:ssä pitää olla).
Rakenteelliset merkkaukset kuvaavat tekstin tarkoitusta. Esimerkiksi <h2>Golf</h2> merkitsee "Golf" toisen asteen otsikoksi, joka näytetään selaimessa samanlaisella tavalla kuin "Merkintä" otsikko tämän osion alussa. Rakenteellinen merkkaus ei määrittele yhtään erityistä näyttötapaa, mutta suurin osa www-selaimista on stanradisoinut, kuinka elementit pitää muotoilla. Tekstejä voi muotoilla edelleen CSS:llä (Cascading Style Sheets).
Esitykselliset merkkaukset kuvaavat tekstin ulkonäön, mutta ei tarkoitusta. Esimerkiksi <b>vahvennettu</b> merkitsee, että se tulisi näyttää vahvennetulta, mutta ei anna tietoa, mitä sellaisen tulostuslaitteen tulisi tehdä, joka ei kykene tekemään tätä (esimerkiksi äänellinen tulostin voi puhua tekstin kovalla äänellä). Kummassakin tapauksessa <b>vahvennettu</b> ja <i>kursiivi</i> on elementtejä, joilla on samanlainen visuaalinen ulkoasu, mutta enemmän merkityksen eroja luonnollisessa kielessä. Samoin <strong>vahva tunne</strong> ja <em>tunne</em>. On helpompi nähdä, kuinka äänellinen käyttöliittymä tulkitsee nämä kaksi viimeistä elementtiä. Suurin osa esityksellisistä merkkauksista ovat vanhentuneet HTML 4.0 spesifikaatiossa ja CSS-pohjaisen tyylinmäärittelyn takia.
Hypertekstin merkkaukset linkittävät osia dokumentista toisiin dokumentteihin. HTML tarvitsee jokaisessa veriossa aina XHTML 1.1 versioon ankkurielementin luodakseen hyperlinkin tekstivirrassa: <a>Wikipedia</a>. Href-attribuutti pitää myös asettaa kelvolliselle URL:ille. Esimerkiksi HTML-koodi <a href="http://en.wikipedia.org/">Wikipedia</a>, näyttää sanan "Wikipedia" hyperlinkkinä. Kuvan linkityksessä ankkuritunniste käyttää seuraavaa syntaksia: <a href="url"><img src="image.gif" alt="alternative text" width="50" height="50"></a>.
[muokkaa] Katso myös
- XHTML - XML ja HTML:n yhteensovitus
- CSS - HTML-merkityn tekstin muotoilukieli
- BBCode - keskustelusivukäyttöön kehitetty merkkikieli