Pääkomponenttianalyysi

Wikipedia
Loikkaa: valikkoon, hakuun

Pääkomponenttianalyysi (engl. Principal components analysis, PCA) on dimension redusointitekniikka. Pääkomponenttianalyysin tavoitteena on löytää monidimensioisesta datasta ne komponentit, joiden avulla sen keskeisimmät piirteet voidaan esittää ilman, että merkittävää informaatiota menee hukkaan.

Pääkomponenttianalyysi on eräs keskeisimpiä menetelmiä hahmontunnistuksessa ja signaalinkäsittelyssä. Samankaltaisia menetelmiä ovat esimerkiksi faktorianalyysi, Karhunen–Loève-muunnos, Hotelling-muunnos ja singulaariarvohajotelma (SVD).

Määritelmä[muokkaa | muokkaa wikitekstiä]

Pääkomponenttianalyysi pyrkii löytämään datasta keskeisimmät komponentit, eli löytämään ne avaruuden pinnat, joille projisoituna data tuottaa suurimman varianssin ja joiden avulla ilmaistuna datasta menee mahdollisimman vähän informaatiota hukkaan.

Voidaan osoittaa, että varianssin maksimoi datan kovarianssimatriisin suurinta ominaisarvoa vastaava ominaisvektori.


\max D^2 (\beta^TX)=\beta^T_1\Sigma\beta_1^T=\lambda_1



y_1= \beta_1^TX


  • y_1 on datamatriisi X:n suurin pääkomponentti

Pääkomponenttianalyysi asettaa siis datamatriisin komponentit suuruusjärjestykseen ominaisarvojen mukaan. Pääkomponenttianalyysin suorittamisen jälkeen tulee vielä suorittaa valinta siitä, että mitkä komponentit voidaan hylätä vähämerkityksisinä, sillä menetelmä ei automaattisesti hylkää mitään komponentteja, vaan ainoastaan asettaa löytämänsä komponentit suuruusjärjestykseen.

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]

Tämä matematiikkaan liittyvä artikkeli on tynkä. Voit auttaa Wikipediaa laajentamalla artikkelia.