Pääkomponenttianalyysi

Tässä artikkelissa tutkimme Pääkomponenttianalyysi:n kiehtovaa maailmaa ja kaikkea sitä, mitä se sisältää. Aiheesta sen alkuperästä sen nykypäivän merkitykseen perehdymme tämän aiheen yksityiskohtaiseen analyysiin, joka on herättänyt niin asiantuntijoiden kuin harrastajienkin huomion. Monitieteisen lähestymistavan kautta tarkastelemme Pääkomponenttianalyysi:een liittyviä eri näkökohtia sen vaikutuksista yhteiskuntaan sen vaikutuksista eri opintoaloihin. Samoin pyrimme ymmärtämään sen historiallista merkitystä ja sen mahdollista kehitystä tulevaisuudessa. Tämän artikkelin tavoitteena on viime kädessä tarjota kattava näkemys Pääkomponenttianalyysi:stä ja tarjota rikastuttava ja valaiseva näkökulma kaikille, jotka ovat kiinnostuneita syventymään tähän aiheeseen.

Pääkomponenttianalyysi (engl. Principal components analysis, PCA) on dimension redusointitekniikka. Pääkomponenttianalyysin tavoitteena on löytää monidimensioisesta datasta ne komponentit, joiden avulla sen keskeisimmät piirteet voidaan esittää ilman, että merkittävää informaatiota menee hukkaan.

Pääkomponenttianalyysi on eräs keskeisimpiä menetelmiä hahmontunnistuksessa ja signaalinkäsittelyssä. Samankaltaisia menetelmiä ovat esimerkiksi faktorianalyysi, Karhunen–Loève-muunnos, Hotelling-muunnos ja singulaariarvohajotelma (SVD).

Määritelmä

Pääkomponenttianalyysi pyrkii löytämään datasta keskeisimmät komponentit, eli löytämään ne avaruuden pinnat, joille projisoituna data tuottaa suurimman varianssin ja joiden avulla ilmaistuna datasta menee mahdollisimman vähän informaatiota hukkaan.

Voidaan osoittaa, että varianssin maksimoi datan kovarianssimatriisin suurinta ominaisarvoa vastaava ominaisvektori.

  • on datamatriisi :n kovarianssimatriisi
  • on kovarianssimatriisi :n suurin ominaisarvo
  • on kovarianssimatriisi :n suurinta ominaisarvoa, :aa vastaava ominaisvektori
  • on datamatriisi :n suurin pääkomponentti

Pääkomponenttianalyysi asettaa siis datamatriisin komponentit suuruusjärjestykseen ominaisarvojen mukaan. Pääkomponenttianalyysin suorittamisen jälkeen tulee vielä suorittaa valinta siitä, että mitkä komponentit voidaan hylätä vähämerkityksisinä, sillä menetelmä ei automaattisesti hylkää mitään komponentteja, vaan ainoastaan asettaa löytämänsä komponentit suuruusjärjestykseen.