Principal Component Analysis (PCA)

PRINCIPAL COMPONENT ANALYSIS (PCA)

A. Hasad
Program Studi Teknik Elektronika
Fakultas Teknik, Universitas Islam 45 (UNISMA)
Jl. Cut Meutia No. 83 Bekasi 17113
Telp. +6221-88344436, Fax. +6221-8801192
Website: andihasad.com, Email: andihasad@yahoo.com

Dalam statistika, analisis komponen utama (principal component analysis / PCA) adalah teknik yang digunakan untuk menyederhanakan suatu data, dengan cara mentransformasi linier sehingga terbentuk sistem koordinat baru dengan varians maksimum. PCA dapat digunakan untuk mereduksi dimensi suatu data tanpa mengurangi karakteristik data tersebut secara signifikan.

Analisis komponen utama  merupakan suatu teknik statistik untuk mengubah dari sebagian besar  variabel asli yang digunakan yang saling berkorelasi satu dengan yang lainnya menjadi satu set variabel baru yang lebih kecil dan saling bebas (tidak berkorelasi lagi). Jadi analisis komponen utama berguna untuk mereduksi data, sehingga lebih mudah untuk menginterpretasikan data-data tersebut (Johnson & Wichern, 1982). Analisis ini merupakan analisis antara dari suatu proses penelitian yang besar atau suatu awalan dari analisis berikutnya, bukan merupakan suatu analisis yang langsung berakhir. Misalnya komponen utama bisa merupakan masukan untuk regresi berganda atau analisis faktor.

Dilihat secara aljabar linier, komponen utama adalah kombinasi linier-kombinasi linier tertentu dari p peubah acak x1,x2,x3,….,xm. Secara geometris kombinasi linier ini merupakan sistem koordinat baru yang didapat dari rotasi sistem semula dengan x1,x2,….,xm sebagai sumbu koordinat. Sumbu baru tersebut merupakan arah dengan variabilitas maksimum dan memberikan kovariansi yang lebih sederhana. Sumber lain merumuskan bahwa PCA merupakan teknik linier untuk memproyeksikan data vektor yang berdimesi tinggi ke vektor yang mempunyai dimensi lebih rendah (Turk, 1991). PCA lebih banyak digunakan untuk keperluan ekstraksi fitur citra, dimana jumlah dimensi dari citra jauh lebih besar dibandingkan dengan jumlah data sampel yang digunakan, untuk melakukan proyeksi sampel vektor dari citra pelatihan, setiap citra pelatihan disusun dalam bentuk vektor baris. Jika jumlah data pelatihan adalah sebanyak m, maka dimensi vektornya adalah mxn. Apabila vektor citra pelatihan mempunyai dimensi mxn tersebut diortogonalisasi dengan menentukan eigenvector dan eigenvalue, maka dimensinya akan berubah menjadi mxm, dimana m<<n.

Referensi :

Hasad A. 2010. Penerapan PCA pada Transformasi Wajah Menggunakan Matlab, Sekolah Pascasarjana IPB, Bogor.

Purnomo H. M., Muntasa A. 2010. Konsep Pengolahan Citra Digital dan Ekstraksi Fitur, Graha Ilmu, Yogyakarta.

Tinggalkan komentar