Prinsip Dasar analisis diskriminan
Analisis diskriminan adalah bagian dari analisis statistik peubah ganda (multivariate statistical analysis) yang bertujuan untuk memisahkan beberapa kelompok data yang sudah terkelompokkan dengan cara membentuk fungsi diskriminan. Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada hubungan dependensi (hubungan antar variabel dimana sudah bisa dibedakan mana variabel respon dan mana variabel penjelas). Lebih spesifik lagi, analisis diskriminan digunakan pada kasus dimana variabel respon berupa data kualitatif dan variabel penjelas berupa data kuantitatif.Menurut Johnson and Wichern (1982 : 470), tujuan dari analisis disriminan adalah untuk menggambarkan ciri-ciri suatu pengamatan dari bermacam-macam populasi yang diketahui, baik secara grafis maupun aljabar dengan membentuk fungsi diskriminan. Dengan kata lain, analisis diskriminan digunakan untuk mengklasifikasikan individu ke dalam salah satu dari dua kelompok atau lebih.jika dianalogikan dengan regresi linear, maka analisis diskriminan merupakan kebalikannya. pada regresi linear, variabel respon yang harus mengikuti distribusi normal dan homoskedastis, sedangkan variabel penjelas diasumsikan fixed, artinya variabel penjelas tidak disyaratkan mengikuti sebaran tertentu. untuk analisis diskriminan, variabel penjelasnya seperti sudah disebutkan di atas harus mengikuti distribusi normal dan homoskedastis sedangkan variabel responnya fixed.
Tujuan analisis diskriminan secara umum
- Mengetahui apakah ada perbedaan yang jelas antara kelompok pada variabel dependen. Bisa juga dikatakan untuk melihat perbedaan antara anggota grup 1 dengan grup 2.
- Jika ada perbedaan, untuk mengetahui variabel bebas mana yang membuat perbedaan tersebut.
- Membuat fungsi atau model diskriminan yang pada dasarnya mirip dengan persamaan regresi.
- Melakukan klasifikasi terhadap objek (dalam terminology spss disebut baris), dan untuk mengetahui apakah suatu objek termasuk pada grup 1 atau grup 2 atau lainnya.
Asumsi dan Sampel dalam analisis diskriminan
- Sejumlah p variabel independen harus berdistribusi normal.
- Matriks ragam-peragam variabel independen berukuran pxp pada kedua kelompok harus sama.
- Tidak ada korelasi antar variabel independen.
- Tidak terdapat data yang outlier pada variabel independen.
Tidak ada jumlah sampel yang ideal secara pasti pada analisis diskriminan. Pedoman yang bersifat umum menyatakan untuk setiap variabel independen terdapat 5-20 sampel. Dengan demikian, jika terdapat 6 variabel independen maka seharusnya terdapat minimal 6x5=30 sampel. Secara terminology spss, jika ada enam kolom variabel independen, sebaiknya ada 30 baris data.
Selain itu, pada analisis diskriminan sebaiknya digunakan dua jenis sampel, yakni analisis sampel yang digunakan untuk membuat fungsi diskriminan, serta holdout sampel (split sampel) yang digunakan untuk menguji hasil diskriminan.
Langkah-langkah dalam analisis diskriminan
- Memisah variabel-variabel menjadi variabel dependen dan variabel independen.
- Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya terdapat dua metode dasar untuk membuat fungsi diskriminan, yakni:
- Simultaneus estimation, semua variabel independen dimasukkan secara bersama-sama kemudian dilakukan proses diskriminan.
- Stepwise estimation, variabel independen dimasukkan satu per satu kedalam model diskriminan. Pada proses ini akan ada variabel yang tetap ada dalam model dan ada variabel yang dibuang dari model.
- Menguji signifikansi dari fungsi diskriminan yang telah terbentuk, menggunakan Wilk’s lamda, Pilai, F test dan uji lainnya.
- Menguji ketepatan klasifikasi dari fungsi diskriminan serta mengetahui ketepatan klasifikasi secara individual dengan casewise diagnostics.
- Melakukan interpretasi terhadap fungsi diskriminan tersebut.
- Melakukan uji validasi terhadap fungsi diskriminan.
Materi lengkapnya mungkin bisa didownlod di materi analisis diskriminan
Untuk Tutorial analisis diskriminan dengan spss silahkan klik [Tutorial] Analisis Diskriminan dengan SPSS
TERIMA KASIH UNTUK INFORMASINYA MAS. SANGAT BERMANFAAT.
ReplyDeleteok gan..
ReplyDeletemakasih dah berkunjung juga.
terima kasih infonya
ReplyDeleteSama sama gan.
DeleteThanks ya gan
ReplyDeleteThanks ya gan
ReplyDeleteMau tanya, apakah pada variabel y kategorinya hanya 2 (misal nakal sedang dan nakal tinggi).. atau bisa >2 kategori (nakal rendah, sedang, tinggi)... apa bedanya dengan regresi ordinal? Tks
ReplyDeleteAd bkunya gak yg hair et al (1987)?
ReplyDeleteJohnson and wichern 1988?
Okay
ReplyDeleteYang di katakan alat dalam analisis diskriminan yang bagai mana y,??
ReplyDeleteYang di katakan alat dalam analisis diskriminan yang bagai mana y,??
ReplyDeleteadmin, link materi lengkapnya error
ReplyDeletedata yang digunakan bagusnya data panel atau cross section untuk analisis diskriminan ini min?
ReplyDelete