Ero sivun ”Tilastotiede” versioiden välillä

Wikipediasta
Siirry navigaatioon Siirry hakuun
[katsottu versio][katsottu versio]
Poistettu sisältö Lisätty sisältö
EmausBot (keskustelu | muokkaukset)
p r2.7.3) (Botti muutti kielilinkin ext:Estadística muotoon ext:Estaística
VolkovBot (keskustelu | muokkaukset)
p r2.7.2) (Botti muutti kielilinkin tl:Estadistika muotoon tl:Palautatan
Rivi 223: Rivi 223:
[[sh:Statistika]]
[[sh:Statistika]]
[[sv:Statistik]]
[[sv:Statistik]]
[[tl:Estadistika]]
[[tl:Palautatan]]
[[ta:புள்ளியியல்]]
[[ta:புள்ளியியல்]]
[[te:సంఖ్యా శాస్త్రం]]
[[te:సంఖ్యా శాస్త్రం]]

Versio 1. maaliskuuta 2013 kello 04.16

Normaalijakauma on tilastotieteessa usein käytetty työkalu

Tilastotiede on todennäköisyyslaskentaan perustuva tieteenala, joka tutkii tilastollisten aineistojen keräämistä, käsittelyä ja tältä pohjalta tehtävää päättelyä.[1] Tilastotieteen avulla voidaan mitata havaintoja ja käsitellä mittausten muodostamia aineistoja, ja tilastotiede tuo siten empiriaa erilaisiin tutkimuksiin. Tilastotieteen tulosten pohjalta tehtävä päättely on induktiivista päättelyä eli aineiston pohjalta pyritään yleistämään asioita yksittäisestä yleiseen, mutta aineistoista ei aina pyritä yleistämään. Havaintoaineistoja voidaan myös hankkia tietyllä aikavälillä eli tuottaa aikasarja. Tilastotiede jaetaan teoreettiseen ja soveltavaan tilastotieteeseen. Tilastotiedettä käytetään tilastollisten tutkimusten tekemiseen ja nämä jaetaan määrällisiin (kvantitatiivisiin) ja laadullisiin (kvalitatiivisiin) tutkimuksiin. Tilastotieteen harjoittajaa kutsutaan tilastotieteilijäksi.

Tilastotiedettä sovelletaan monilla tutkimusaloilla, joihin kuuluvat esimerkiksi luonnon-, yhteiskunta- ja humanistiset tieteet. Tilastollisella päättelyllä on tärkeä osuus tieteellisessä hypoteesin testauksessa. Tilastotiedettä käytetään myös teollisuudessa. Tilastotiedettä hyödynnetään myös valtion ja kuntien virallisissa tilastoissa sekä kansantalouden tilan selvittämisessä, ja historiallisesti julkinen valta oli ensimmäinen tilastojen hyödyntäjä. Vuonna 1749 laadittiin Suomen ensimmäinen väestötilasto.[2] Suomessa Tilastokeskus tuottaa valtaosan Suomen virallisista tilastoista.[3] Myös Suomen Pankki tuottaa merkittävän määrän virallisia tilastoja.[4]

Kun tilastotieteen menetelmiä käytetään aineiston esittämiseen, on kyse lähinnä kuvailevasta tilastotieteestä. Kun kuvailusta siirrytään aineiston tarkasteluun tai mallinnukseen siten, että aineiston epävarmuus ja havaintojen satunnaisuus otetaan huomioon, puhutaan tilastollisesta päättelystä. Näissä molemmissa tapauksissa on kyse soveltavasta tilastotieteestä. Matemaattinen tilastotiede keskittyy puolestaan tarkastelemaan tilastotieteen teoreettista perustaa. Tilastotieteessä keskeisiä asioita ovat otantamenetelmät, mitta-asteikot, keskiluvut sekä vaihtelun ja riippuvuuden tunnusluvut. Tilastollisten tutkimusten tekeminen edellyttää suunnitelmallisuutta tutkimussuunnitelman muodossa, koska se luo pohjan sille, mitä kerätystä aineistoista voidaan lopulta saada irti.

Lähestymistapa

Tilastotieteen soveltaminen tarkasteltavaan tieteelliseen, teolliseen tai yhteiskunnalliseen ongelmaan alkaa populaation määrittelyllä. Kyseessä voi olla jonkin maan väestö tai tehtaan valmistamat tuotteet. Toisaalta voidaan havainnoida aineistoa tuottava prosessi eri ajankohtina, jolloin kyseessä on aikasarja.

Aineistoa on tavallisesti mahdollista kerätä vain populaation osajoukosta, jolloin tutkimuksen kohteena on otos. Otoksesta voidaan kerätä aineistoa joko havainnoiden tai kokeellisessa asetelmassa. Kun aineisto on kerätty, siitä tehtävä analyysi voidaan jakaa kuvailuun ja päättelyyn, jotka tosin liittyvät usein toisiinsa läheisesti:

Tilastotieteessä on tärkeää tehdä ero kausaliteetin ja korrelaation välillä. Kausaliteetti eli syy-seuraussuhde tarkoittaa tilastollisessa yhteydessä, että yhden muuttujan arvosta seuraa toisen muuttujan arvo. Kahden muuttujan välinen korrelaatio taas tarkoittaa, että niiden arvot vaihtelevat aineistossa yhdessä, mutta kausaliteetin suuntaan ei oteta kantaa. Esimerkiksi tulojen ja eliniän tutkimus voi osoittaa, että rikkaat elävät köyhiä pidempään. Tällöin tulot ja elinikä ovat aineistossa korreloituneita. Tästä ei voida kuitenkaan johtaa kausaalisuhdetta, jonka mukaan varallisuus lisäisi elinikää. Korrelaatio voi syntyä kolmannen havaitsemattoman muuttujan vaikutuksesta, joka saattaisi olla esimerkiksi terveyspalveluiden saatavuus.

Jos tarkasteltava otos on edustava eli kuvaa populaatiota, voidaan tilastollinen päättely laajentaa otoksesta koko populaatioon. Keskeinen ongelma on se, missä määrin otos on edustava. Tilastotieteen menetelmät mahdollistavat satunnaisvaihtelun huomioimisen, joka syntyy otoksen keräämisestä eli otannasta. Toisaalta koesuunnittelun teoria tarkastelee kontrolloitujen kokeiden suorittamista.

Menetelmiä

Aineisto kerätään kiinnostuksen kohteena olevasta populaatiosta otantamenetelmän avulla. Satunnaisotannassa kullakin populaation jäsenellä on sama todennäköisyys tulla poimituksi. Ennen aineiston käsittelyä on tiedettävä, millä mitta-asteikolla kukin havainto on mitattu. Havaintojen perusteella pyritään tekemään päätelmiä kiinnostuksen kohteena olevan muuttujan jakaumasta .

Frekvenssi kertoo kuinka monta havaintoa on annetussa havaintoluokassa.

Aineistoa kuvailevia tunnuslukuja

Sijainnin tunnuslukuja eli keskilukuja:

Vaihtelun tunnuslukuja:

Riippuvuuden tunnuslukuja:

Tilastollisia testejä

Tilastollisilla testeillä testataan tunnusluvuille tai parametreille asetettuja hypoteeseja. Testisuure lasketaan olettaen nollahypoteesin olevan totta. Jos aineiston perusteella laskettu tunnusluku poikkeaa nollahypoteesista ja aineiston vaihtelu on riittävän pientä suhteessa otoksen kokoon, nollahypoteesi voidaan hylätä valitulla merkitsevyystasolla. Vaihtoehtoisesti nollahypoteesi jää voimaan. Merkitsevyystaso kuvaa testin todennäköisyyttä hylätä nollahypoteesi virheellisesti. Testin voima on todennäköisyys millä nollahypoteesi hylätään kun vaihtoehtoinen hypoteesi on tosi.

Mallinnusmenetelmiä

Otantamenetelmiä

Tutkimusalueita

Ohjelmistoja

Vapaita tilasto-ohjelmistoja:

Kaupallisia tilasto-ohjelmistoja:

Lähteet

  1. Kielitoimiston sanakirja. Kotimaisten kielten tutkimuskeskuksen julkaisuja 132. Internet-versio MOT Kielitoimiston sanakirja 1.0. Helsinki: Kotimaisten kielten tutkimuskeskus ja Kielikone Oy, 2004. ISBN 952-5446-11-5.
  2. http://www.stat.fi/org/historia/index.html
  3. http://www.stat.fi/org/index.html
  4. http://www.suomenpankki.fi/fi/tilastot/Pages/default.aspx

Katso myös

Wikibooks
Wikibooks

Kirjallisuutta

  • Grönroos, Matti: Johdatus tilastotieteeseen: Kuvailu, mallit ja päättely. Helsinki: Finn Lectura, 2003. ISBN 951-792-148-9.
  • Heikkilä, Juha: Tilastotieteen ABC-kirja. 1, Kuvailevaa tilastotiedettä. Helsinki: Yliopistopaino, 1993. ISBN 951-570-184-8.
  • Heikkilä, Tarja: Tilastollinen tutkimus. 7. uudistettu painos. Helsinki: Edita, 2008. ISBN 978-951-37-4812-8.
  • Holopainen, Martti & Pulkkinen, Pekka: Tilastolliset menetelmät. Kuvitus: Krista Partti. 5. uudistettu painos. Porvoo Helsinki: WSOY Oppimateriaalit, 2008. ISBN 978-951-0-33198-9.
  • Valli, Raine: Johdatus tilastolliseen tutkimukseen. Opetus 2000. Jyväskylä: PS-kustannus, 2001. ISBN 952-451-032-4.

Aiheesta muualla

Commons
Commons
Wikimedia Commonsissa on kuvia tai muita tiedostoja aiheesta Tilastotiede.

Malline:Link FA