Pääkomponenttianalyysi
Pääkomponenttianalyysi (engl. Principal components analysis, PCA) on dimension redusointitekniikka. Pääkomponenttianalyysin tavoitteena on löytää monidimensioisesta datasta ne komponentit, joiden avulla sen keskeisimmät piirteet voidaan esittää ilman, että merkittävää informaatiota menee hukkaan.
Pääkomponenttianalyysi on eräs keskeisimpiä menetelmiä hahmontunnistuksessa ja signaalinkäsittelyssä. Samankaltaisia menetelmiä ovat esimerkiksi faktorianalyysi, Karhunen–Loève-muunnos, Hotelling-muunnos ja singulaariarvohajotelma (SVD).
Määritelmä [muokkaa]
Pääkomponenttianalyysi pyrkii löytämään datasta keskeisimmät komponentit, eli löytämään ne avaruuden pinnat, joille projisoituna data tuottaa suurimman varianssin ja joiden avulla ilmaistuna datasta menee mahdollisimman vähän informaatiota hukkaan.
Voidaan osoittaa, että varianssin maksimoi datan kovarianssimatriisin suurinta ominaisarvoa vastaava ominaisvektori.
on datamatriisi
:n kovarianssimatriisi
on kovarianssimatriisi
:n suurin ominaisarvo
on kovarianssimatriisi
:n suurinta ominaisarvoa,
:aa vastaava ominaisvektori
on datamatriisi
:n suurin pääkomponentti
Pääkomponenttianalyysi asettaa siis datamatriisin komponentit suuruusjärjestykseen ominaisarvojen mukaan. Pääkomponenttianalyysin suorittamisen jälkeen tulee vielä suorittaa valinta siitä, että mitkä komponentit voidaan hylätä vähämerkityksisinä, sillä menetelmä ei automaattisesti hylkää mitään komponentteja, vaan ainoastaan asettaa löytämänsä komponentit suuruusjärjestykseen.
Aiheesta muualla [muokkaa]
- Ilkka Mellin: Pääkomponenttianalyysi (pdf) Ilkka Mellin, Teknillinen korkeakoulu. Viitattu 22.1.2008.

on datamatriisi
:n
on kovarianssimatriisi
on kovarianssimatriisi 
on datamatriisi