Ero sivun ”Keskeinen raja-arvolause” versioiden välillä

Siirry navigaatioon Siirry hakuun
luettavuutta parannettu johdannossa
p (fix)
(luettavuutta parannettu johdannossa)
'''Keskeinen raja-arvolause''' on [[todennäköisyyslaskenta|toden­näköisyys­laskennan]] tulos, jonka mukaan keskiarvo riittävän suuresta määrästä toisistaan [[riippumaton muuttuja|riippumattomia]] [[satunnaismuuttuja|satunnais­muuttujia]], joista kullakin on hyvin määritelty [[odotusarvo]] ja [[varianssi]], on tietyin edellytyksin likipitäen [[normaalijakauma|normaalisti jakautunut]] riippumatta kunkin satunnaismuuttujan omasta jakaumasta.<ref>{{verkkoviite | Osoite = http://www.math.uah.edu/stat/sample/CLT.htm | Nimeke = The Central Limit Theorem | Viitattu = 7.1.2015}}</ref><ref>{{kirjaviite | Tekijä = Rice, John | Nimeke = Mathematical Statistics and Data Analysis, 2. painos | Julkaisija = Duxbury Press | Vuosi = 1995 | Tunniste = ISBN 0-534-20934-3}}</ref> Sen havain­nol­lis­ta­mi­sek­si, mitä tämä merkitsee, kuvitellaan, että on muodostettu suuren määrän havaintoja käsittävä otos ja että kukin havainto on generoitu satunnaisesti tavalla, johon muut havainto­kerrat eivät vaikuta, ja että lasketaan havainto­arvojen keskiarvo. Jos tämä toistetaan monta kertaa, keskeisen raja-arvo­lauseen mukaan niiden keskiarvo jakautuu toden­näköisesti sitä tarkemmin normaali­jakauman eli niin sanotun kellokäyrän mukaisesti. Esimerkiksi jos [[kolikon heittäminen|kolikkoa heitetään]] suuri määrä kertoja, toden­näköisyys saada kruuna tietyllä määrällä kertoja noudattaa normaali­jakaumaa, jonka [[odotusarvo]] on puolet heittojen lukumäärästä.
'''Keskeinen raja-arvolause''' on [[todennäköisyyslaskenta|toden­näköisyys­laskennan]] tulos, jonka mukaan keskiarvo
 
riittävän suuresta määrästä toisistaan [[riippumaton muuttuja|riippumattomia]] [[satunnaismuuttuja|satunnais­muuttujia]], joista kullakin on hyvin määritelty [[odotusarvo]] ja [[varianssi]], on tietyin edellytyksin likipitäen [[normaalijakauma|normaalisti jakautunut]] riippumatta kunkin satunnaismuuttujan omasta jakaumasta.<ref>{{verkkoviite | Osoite = http://www.math.uah.edu/stat/sample/CLT.htm | Nimeke = The Central Limit Theorem | Viitattu = 7.1.2015}}</ref><ref>{{kirjaviite | Tekijä = Rice, John | Nimeke = Mathematical Statistics and Data Analysis, 2. painos | Julkaisija = Duxbury Press | Vuosi = 1995 | Tunniste = ISBN 0-534-20934-3}}</ref> Sen havain­nol­lis­ta­mi­sek­si, mitä tämä merkitsee, kuvitellaan, että on muodostettu suuren määrän havaintoja käsittävä otos ja että kukin havainto on generoitu satunnaisesti tavalla, johon muut havainto­kerrat eivät vaikuta, ja että lasketaan havainto­arvojen keskiarvo. Jos tämä toistetaan monta kertaa, keskeisen raja-arvo­lauseen mukaan niiden keskiarvo jakautuu toden­näköisesti sitä tarkemmin normaali­jakauman eli niin sanotun kellokäyrän mukaisesti. Esimerkiksi jos [[kolikon heittäminen|kolikkoa heitetään]] suuri määrä kertoja, toden­näköisyys saada kruuna tietyllä määrällä kertoja noudattaa normaali­jakaumaa, jonka [[odotusarvo]] on puolet heittojen lukumäärästä.
Lausetta voi havainnollistaa muodostamalla suuren määrän havaintoja käsittävä otos, jossa kukin havainto on generoitu satunnaisesti muista havaintokerroista riippumatta. Tämän jälkeen lasketaan otoksen eli havaintojen keskiarvo. Jos tämä toistetaan monta kertaa, keskeisen raja-arvo­lauseen mukaan niiden keskiarvo jakautuu toden­näköisesti sitä tarkemmin normaali­jakauman eli niin sanotun kellokäyrän mukaisesti. Esimerkiksi jos [[kolikon heittäminen|kolikkoa heitetään]] erittäin monta kertaa, toden­näköisyys saada kruuna tietyllä määrällä kertoja noudattaa normaali­jakaumaa, jonka [[odotusarvo]] on puolet heittojen lukumäärästä.
 
Keskeisestä raja-arvo­lauseesta on monia muunnelmia. Sen kauimmin tunnettu muoto edellyttää, että satunnais­muuttujat, joiden keskiarvoa tarkastellaan, ovat samoin jakautuneet. Satunnais­muuttujien keskiarvo kuitenkin [[suppeneminen|suppenee]] kohti normaali­jakaumaa tietyin edellytyksin useissa sellaisissakin tapauksissa, joissa ne eivät ole samoin jakautuneet eivätkä edes toisistaan riippumattomat.
Vastaava tulos voidaan esittää myös [[Fourier-muunnos|Fourier-muunnoksille]], sillä karakteristinen funktio on
oleellisesti Fourier-muunnos.
 
 
==Lauseen laajennuksia ==
 
[[Tiedosto:Central Limit Theorem.png|thumb|640px|Binomijakaumaan perustuva simulaatio. Valitaan useita kertoja satunnaisesti luku 0 tai 1, ja tulosten keskiarvo lasketaan, kun näin on tehty 1...512 kertaa. Voidaan nähdä, että kun otoskoko kasvaa, keskiarvojen jakauma kapenee ja tulee molemmissa ääripäissään matalaksi.]]
 
Yksinkertainen esimerkki keskeisestä raja-arvolauseesta saadaan heittämällä suurta määrää samanlaisia, "painottamattomia" noppia. Saatujen silmälukujen summa (tai vaihtoehtoisesti keskiarvo) noudattaa tällöin likimain normaali­jakaumaa. Koska reaalimaailman suureet ovat usein monien havaitsematta jääneiden satunnais­ilmiöiden painotettuja keskiarvoja, keskeinen raja-arvolause osaltaan myös selittää, miksi normaalijakauma esiintyy mitä erilaisimmissa ilmiöissä. Siihen perustuu myös normaali­jakauman käyttö likiarvona suuria otoksia koskevia kontrolloiduissa tilastollisissa kontrolloiduissa kokeissa.
 
<!--[[File:Empirical CLT - Figure - 040711.jpg|none|thumb|500px|This figure demonstrates the central limit theorem. The sample means are generated using a random number generator, which draws numbers between 0 and 100 from a uniform probability distribution. It illustrates that increasing sample sizes result in the 500 measured sample means being more closely distributed about the population mean (50 in this case). It also compares the observed distributions with the distributions that would be expected for a normalized Gaussian distribution, and shows the [[Pearson's chi-squared test|chi-squared]] values that quantify the goodness of the fit (the fit is good if the reduced [[Pearson's chi-squared test|chi-squared]] value is less than or approximately equal to one). The input into the normalized Gaussian function is the mean of sample means (~50) and the mean sample standard deviation divided by the square root of the sample size (~28.87/{{sqrt|''n''}}), which is called the standard deviation of the mean (since it refers to the spread of sample means).]]-->
2 583

muokkausta

Navigointivalikko