Sabtu, 05 Februari 2022

Menentukan variabel yang berpengaruh menggunakan Principal of Component Analysis (PCA)

Pada berbagai riset di bidang perikanan dan kelautan, kadang peneliti dihadapkan dengan situasi dimana data pengukuran kualitas perairan yang telah diambil sangat banyak namun kesulitan untuk menentukan parameter atau variabel mana yang paling mempengaruhi kondisi lingkungan/sampel dari fenomena riset yang ditemui. Salah satu tools yang mudah dan dapat diaplikasikan ke dalam riset tersebut adalah menggunakan metode Principal of Component Analysis (PCA).

PCA atau dalam bahasa indonesia disebut sebagai analisis komponen utama, merupakan suatu metode dalam statistika yang dapat digunakan untuk menyederhanakan data dengan mentransformasikannya secara linier membentuk sistem koordinat dimana masing-masing kuadran memiliki varians yang spesifik. Di dalam metode PCA, data dibagi menjadi beberapa kluster untuk memudahkan interpretasi hasil, yang secara umum teknik ini mirip sekali dengan teknik clustering. Kelebihan lain dari metode PCA adalah tidak memerlukan dependent variables, sehingga interpretasi yang diberikan mirip dengan teknik clustering K-means menggunakan pendekatan unsupervised learning.

Secara umum, PCA memberikan hasil akhir yaitu dapat mengetahui dan menganalisis faktor mana yang paling berperan untuk menjelaskan fenomena dalam dataset dengan tetap menjaga sifat-sifat data (variansi maksimum).

Beberapa aplikasi yang dapat digunakan untuk menggunakan pendekatan metode ini diantaranya adalah SPSS, MiniTab, MS Excel dan XLSTAT. Meskipun memiliki tampilan yang berbeda-beda, pada umumnya akan memiliki hasil pembacaan yang sama; yaitu data yang berada di dalam satu kuadran memiliki karakteristik yang sama, sehingga data tersebut merupakan data yang paling mempengaruhi kondisi fenomena yang diteliti. 

Sebagai contoh, kita misalkan seorang peneliti ingin mengetahui perbedaan karakteristik kepiting yang dibudidayakan di area pesisir (A), tambak darat dekat pesisir (B), muara (C), hingga laut lepas (D). Data yang diambil adalah sebagai berikut:


Data yang diambil masing-masing dua data panjang kepiting di 4 lokasi penelitian, dengan 5 pengukuran kualitas perairan. Selanjutnya, peneliti ingin mengetahui faktor kualitas perairan apa yang paling berpengaruh terhadap perbedaan panjang kepiting di berbagai lokasi tersebut.



Analisis PCA mengelompokkan pH dan suhu ke dalam satu kuadran, DO dan salinitas ke dalam kuadran panjang kepiting, serta TSS sebagai variabel yang tidak berkaitan dengan variabel-variabel lainnya. Sehingga, secara umum, menurut analisis PCA, perbedaan panjang kepiting, sangat dipengaruhi oleh kadar DO dan salinitas yang tersedia di perairan tersebut.

Tidak ada komentar:

Posting Komentar