Wikipedia:Lupaavat artikkelit/Luokitteluehdotus

Wikipediasta
Siirry navigaatioon Siirry hakuun

Lupaavien artikkeleiden määrän kasvaessa on tullut ajankohtaiseksi miettiä niiden organisointia. Wikipedia:Lupaavat artikkelit -sivu on jo tällä hetkellä aika pitkä ja linkkimäärän edelleen kasvaessa tiedon löytäminen sivulta ja listan ylläpitäminen muuttuu kokoajan hankalammaksi.

Tämän sivun on tarkoitus toimia avauksena sen pohtimiselle miten artikkelit voitaisiin käsin ylläpidetyn listan sijaan luokitella.

Organisointiehdotus[muokkaa wikitekstiä]

  • Käsin ylläpidettävän Lupaavat artikkelit -listan sijaan artikkelit arvioinnin yhteydessä artikkelit luokiteltaisiin.
  • Luokituksen perusteella tehtäisiin automaattisesti päivittyviä listoja jotka vastaavat nykyistä lupaavat artikkelit sivua.
Luokituksista
  • Tehtävä luokkahierarkia olisi irrallaan nykyisestä pääluokituksesta.
  • Luokittelu olisi yleisen kymmenluokittelun tyyppinen ja jossa:
  • Luokkien määrää ja hierarkian syvyyttä pidettäisiin minimaalisena. Uusia luokkia lisättäisiin vain harkiten.
  • Pääpiirteissään luokitukset noudattaisivat jotain yleisesti käytössä olevaa luokittelua. Esimerkiksi yleisten kirjastojen luokitusjärjestelmän luokituksia tai Deweyn luokittelua.
  • Luokkien nimet olisivat muotoa "29.51 Itä-Aasian uskonnot ja mytologiat" tai pelkästään numeroita, joka estää nimitörmäykset nykyisten luokkien kanssa.
  • Artikkelit ja luokat luokiteltaisiin ainoastaan yhteen yläluokkaan.

Hyvät puolet[muokkaa wikitekstiä]

  • Kymmenluokittelu on yksinkertainen ja helppo hahmottaa
  • Skaalautuu hyvin ja on silti käsin ylläpidettävissä
  • Luokituksista löytyy useita esimerkkejä
  • Yleisesti käytössä olevan luokituksen käyttö helpottaa Wikipedian sisällön vertaamista muihin sisältöarkistoihin.
  • Kymmenluokitukset ovat helposti ohjelmallisesti tulkittavissa.

Huonot puolet[muokkaa wikitekstiä]

  • Ehdotuksen ideana on luoda rinnakkainen luokitusjärjestelmä nykyisen luokituksen kanssa (vrt tynkäluokat)
  • Artikkelit liittyvät hyvin harvoin ainoastaan yhteen asiaan ja luokitteleminen ainoastaan yhteen luokkaan yksinkertaistaa asioita rankasti
  • Kymmenluokituksiin on hankala jälkikäteen lisätä kokonaan uusia aihepiirejä.

Olemassa olevia luokitusjärjestelmiä[muokkaa wikitekstiä]

Vaikka kymmenluokitus on ideana vapaa, niin eri tahojen käyttämät metadatat ja luokkahierarkiat ovat niitä ylläpitävien tahojen omistamia eivätkä välttämättä sovellu tekijänoikeudellisesti Wikipedian käyttöön. Toisaalta todennäköisesti tehtävä luokittelu on sen verran pienimuotoista ettei luokkahierarkioiden tekijänoikeuskysymykset ole missään vaiheessa olennaisia vaikka jotain tiettyä mallina käyttäisimmekin.

Dewey Decimal Classification (DDC)[muokkaa wikitekstiä]

  • Julkaissut alunperin Melvil Dewey vuonna 1876.
  • Deweyn luokitus on käytetyin yksittäinen luokitusjärjestelmä maailmassa.
  • Luokitukset ovat muotoa: 364.168
  • Deweyn luokittelun nykyversion omistaa OCLC Online Computer Library Center, Inc. ja se on julkaistu Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 Unported -lisenssin alaisena. [1]
  • Ei voi käyttää suoraan wikipediassa; OCLC:llä ja kirjasto-/nettiyhteisöillä on ollut ongelmia lisensoinnin suhteen.
  • Itse numerot eivät ole suojattua, ainoastaan numero->nimi yhdistelmät. [2]
  • 000-999 tasosta on olemassa vapaa Free decimal correspondence, [3]
  • LibraryThing käyttää FDC:hen perustuvaa omaa Melvil Decimal System:ään. (lisenssi tuntematon)

Yleinen kirjastoluokitusjärjestelmä (YKL)[muokkaa wikitekstiä]

  • Käytössä suomen yleisissä kirjastoissa
  • Luokitukset ovat muotoa 36.168
  • Kotisivut: Verkko-YKL
  • Omistajana opetusministeriö. Lisenssipolitiikka ja suhtautuminen copyleft-lisensointiin tuntematon.

Helsingin kaupunginkirjaston luokitusjärjestelmä[muokkaa wikitekstiä]

British library:n luokitusjärjestelmä[muokkaa wikitekstiä]

  • British Library on julkaissut luettelointitietonsa avoimena datana, joka käytännössä tarkoittaa koko heidän kansallisbibliografiaa. [5]
  • Www-haku käyttää kirjoissa yhtä dewey luokitusta ja/tai selväkielisiä kategorialuokkia.
  • Lisensointi: Creative Commons CC0 1.0 Universal Public Domain Dedication licence [6]
    • Olisiko British Libraryn julkaiseman datasetin pohjalta luotu Deweyn luokittelu tekijänoikeuksiltaan vapaa ja Wikipedialle sopiva?

UDK (Universal Decimal Classification, UDC)[muokkaa wikitekstiä]

  • Käytössä tieteellisissä kirjastoissa
  • Kotisivut: http://www.udcc.org/
  • Omistajana UDC Consortium. UDC Summary joka sisältää 2000 luokkaa on julkaistu Creative Commons Attribution Share Alike 3.0 -lisenssin alaisena.

Mikäli luokitukset toimivat lupaavien artikkeleiden kohdalla hyvin niin myöhemmin voitaisiin luokitella myös hyvät ja suositellut artikkelit jolloin saadaan ns. kunnossa olevat artikkelit aihekohtaiseksi hakemistoksi.

Nykyisen pääluokituksen ongelmia[muokkaa wikitekstiä]

Osa luokista joihin Mihaela Loghin kuuluu.

Nykyisen pääluokituksessa yksittäisillä tasoilla ylä- ja alaluokat liittyvät toisiinsa ja ovat loogisia, mutta vapaamuotoisen yhdistelyn tuloksena lopputulos on hankalasti ennustettavissa joka tekee tiedon automatisoidun käsittelyn vaikeaksi.

Esimerkiksi pääluokituksessa romanialainen yleisurheilija Mihaela Loghin löytyy alaluokkien kautta luokkien geotieteet, automaatio, politiikka tai korkeakoulutus alta. (ks. esimerkkikuva). Toinen ennustamattomuutta lisäävä seikka on, että artikkeleista on luokiteltu suoraan luokkiin ja osa artikkelikohtaisten meta-luokkien avulla (vrt Martti Suosalo vs Ismo Alanko ja Ismo Alanko -luokka).

Lisäksi nykyisten luokkien runsaus ja hajanaisuus tekee artikkeleiden löytämisestä luokkien avulla hankalaa. Ongelmista huolimatta luokkahierarkia on kuitenkin niin suuri, ettei mitään nopeaa muutosta luokituksen perusrakenteeseen ole tiedossa.

Aiheesta muualla[muokkaa wikitekstiä]