Tässä artikkelissa tutkimme Pääkomponenttianalyysi:n kiehtovaa maailmaa ja kaikkea sitä, mitä se sisältää. Aiheesta sen alkuperästä sen nykypäivän merkitykseen perehdymme tämän aiheen yksityiskohtaiseen analyysiin, joka on herättänyt niin asiantuntijoiden kuin harrastajienkin huomion. Monitieteisen lähestymistavan kautta tarkastelemme Pääkomponenttianalyysi:een liittyviä eri näkökohtia sen vaikutuksista yhteiskuntaan sen vaikutuksista eri opintoaloihin. Samoin pyrimme ymmärtämään sen historiallista merkitystä ja sen mahdollista kehitystä tulevaisuudessa. Tämän artikkelin tavoitteena on viime kädessä tarjota kattava näkemys Pääkomponenttianalyysi:stä ja tarjota rikastuttava ja valaiseva näkökulma kaikille, jotka ovat kiinnostuneita syventymään tähän aiheeseen.
Tähän artikkeliin tai osioon ei ole merkitty lähteitä, joten tiedot kannattaa tarkistaa muista tietolähteistä. Voit auttaa Wikipediaa lisäämällä artikkeliin tarkistettavissa olevia lähteitä ja merkitsemällä ne ohjeen mukaan. |
Pääkomponenttianalyysi (engl. Principal components analysis, PCA) on dimension redusointitekniikka. Pääkomponenttianalyysin tavoitteena on löytää monidimensioisesta datasta ne komponentit, joiden avulla sen keskeisimmät piirteet voidaan esittää ilman, että merkittävää informaatiota menee hukkaan.
Pääkomponenttianalyysi on eräs keskeisimpiä menetelmiä hahmontunnistuksessa ja signaalinkäsittelyssä. Samankaltaisia menetelmiä ovat esimerkiksi faktorianalyysi, Karhunen–Loève-muunnos, Hotelling-muunnos ja singulaariarvohajotelma (SVD).
Pääkomponenttianalyysi pyrkii löytämään datasta keskeisimmät komponentit, eli löytämään ne avaruuden pinnat, joille projisoituna data tuottaa suurimman varianssin ja joiden avulla ilmaistuna datasta menee mahdollisimman vähän informaatiota hukkaan.
Voidaan osoittaa, että varianssin maksimoi datan kovarianssimatriisin suurinta ominaisarvoa vastaava ominaisvektori.
Pääkomponenttianalyysi asettaa siis datamatriisin komponentit suuruusjärjestykseen ominaisarvojen mukaan. Pääkomponenttianalyysin suorittamisen jälkeen tulee vielä suorittaa valinta siitä, että mitkä komponentit voidaan hylätä vähämerkityksisinä, sillä menetelmä ei automaattisesti hylkää mitään komponentteja, vaan ainoastaan asettaa löytämänsä komponentit suuruusjärjestykseen.