Mar 21, 2013

[Tutorial] Analisis Diskriminan dengan SPSS

Contoh Kasus Analisis Diskriminan

Suatu penelitian ingin mengetahui karakteristik sosial demografi yang dapat membedakan antar kelompok anak berdasarkan level kenakalannya di PSMP Handayani dan BRSMP Harapan dan ingin mengetahui karakteristik sosial dan demografi anak nakal tersebut berdasarkan jenis kenakalan yang dilakukan oleh anak yang dibina di PSMP Handayani dan BRSMP Harapan. Maka analisis yang digunakan dalam penelitian tersebut adalah analisis diskriminan.
Variabel independen yang digunakan:

X1: Kenakalan
X2: Nilai tes IQ
X3: Kecerdasan Emosional
X4: Perilaku sebelum masuk panti
X5: Keharmonisan keluarga
X6: Pendidikan Anak
X7: Rata-rata Lama Bermain
X8: Umur Anak
X9: Jumlah Anggota rumah tangga
X10: Jumlah Bersaudara Kandung
X11: Pendidikan Pengasuh

Variabel dependen: Y: Tingkat Kenakalan : (Nakal menengah keatas dan Nakal Ringan)

Berikut Langkah-langkah dalam analisis diskriminan:

  1. Masukkan data yang akan diolah. seperti pada gambar di bawah.
    data diskriminan
  2. Pada menu Analyze, pilih submenu Classsify, lalu pilih Discriminant. Pada kotak dialog Discriminant Analysis, pindahkan Nakal_Rev2 ke dalam Grouping Variable, lalu klik Define Range.
    discriminant analysis
  3. Lalu pada kotak kecil, bagian minimum diisi dengan kode terkecil dan maximum diisi dengan kode terbesar dari variabel respon, pada contoh kasus disini,masukkan angka “1” untuk minimum dan “2” untuk maximum. Kemudian klik Continue.
    define dependent
  4. Kembali ke kotak dialog Discriminant Analysis, lalu pada Independents diisi dengan variabel penjelas. Metode yang sering dipaparkan pada literatur-literatur adalah metode bertatar (stepwise), maka kali ini hanya akan diberi contoh penggunaan metode ini. Pada contoh kasus di sini, variabel independents adalah variabel yang tersisa tadi. Kemudian pindahkan variable yang tersisa ke dalam Independents.lalu, pilih dan klik Statistics.
    choose independent
  5. Pada kotak kecil, centangkan kotak means, univariate ANOVA’s, Box’s M, serta Unstandardized. Lalu, Continue.
    descriptive diskriminan
  6. Kembali ke kotak dialog Discriminant Analysis, lalu pada Classification, lalu diberi tanda cek di All group equal, Casewise result, Summary table, dan Within-groups. Lalu, klik Continue.

Interpretasi hasil analisis diskriminan

Uji Asumsi Analisis diskriminan

Uji Kesamaan matriks ragam-peragam antar kelompok

Pada kasus ini, kita menguji asumsi kesamaan matrik ragam-peragam antara kelompok nakal menengah ke atas dan nakal ringan digunakan statistic uji Box’s M.
box m test

Dengan tingkat kepercayaan 95%, kelompok-1 dan kelompok-2 memiliki matriks ragam-peragam yang sama dilihat nilai sig 0.46 yang lebih besar dari 0.05(alpha). Asumsi semua kelompok memiliki matrik ragam-peragam yang sama terpenuhi. Selain itu, kesimpulan dapat diambil dengan melihat nilai log determinan dari tiap-tiap kelompok pada tabel log determinants. Nilai log determinan kelompok menengah ke atas = 13.103 dan kelompok ringan = 12.132. Hasil keduanya relative sama, yang mengindikasikan ragam-peragam untuk tiap kelompok sama.

Perbedaan rata-rata antar kelompok

Untuk uji perbedaan rata-rata antar kelompok menggunakan uji wilks lambda.
Dengan melihat nilai signifikansi yang lebih kecil dari alpha (0.05), sehingga dapat dikatakan bahwa terdapat perbedaan rata-rata antara kelompok 1 dan kelompok 2 dengan asumsi perbedaan rata-rata antar kelompok terpenuhi.
Selain itu, juga dapat dilihat dari hasil tabel Test of Equality of Group Means mengenai perbedaan signifikan antar kelompok pada setiap peubah bebas.
test of equality
Dari hasil Tabel Test Of Equality Of Group Means kita dapat mengetahui hal sebagai berikut.
  1. Karakteristik IQ, Kecerdasan Emosional, Sikap, Keharmonisan Keluarga, Lama SekolahAnak, Lama waktu bermain, dan Umur memiliki P-value < 0,05 berarti bahwa kategori anak nakal ringan berbeda signifikan dengan anak nakal menengah ke atas. Terdapat 7 peubah yang signifikan berbeda antar kelompok.
  2. Dalam pengolahan SPSS nilai jumlah peubah p, dari hasil output ini terdapat 70% dari p yang berbeda signifikan. Karena ≥ 50% p, maka analisis diskriminan dapat dilakukan.
  3. Asumsi perbedaan rata-rata antar kelompok telah terpenuhi karena lebih dari 50 persen dari total peubah yang dianalisis telah signifikan berbeda antar kelompok.
  4. Tiga peubah yang tidak signifikan yaitu jumlah anggota rumah tangga, jumlah saudara kandung, dan lama sekolah pengasuh. Ketiga peubah yang tidak lolos akan dikeluarkan dari daftar peubah yang akan disertakan pada analisis diskriminan.

Analisis Hasil Analisis Diskriminan

Stepwise statistics

Berdasarkan hasil dari proses stepwise method dengan iterasi sebanyak empat kali didapatkan empat peubah yang signifikan membedakan kelompok nakal menengah ke atas dan nakal ringan karena nilai signifikansinya yang lebih kecil dari 0,05. Dengan tingkat residual error yang semakin kecil yang dinyatakan oleh Wilk’s Lambda mulai dari level 0,414 dan terus berkurang hingga mencapai 0,270 setelah keempat peubah tersebut terpilih untuk dimasukkan ke dalam fungsi diskriminan. Hal ini berarti kemampuan diskriminasi dari fungsi yang dihasilkan semakin meningkat.

Summary of Canonical Discriminant

Nilai akar ciri (eigen value) menunjukkan ada atau tidaknya multikolinearitas antar peubah bebas. Multikolinearitas akan terjadi bila nilai akar ciri (eigen value) mendekati 0 (nol). Berdasarkan hasil pengolahan data didapatkan nilai akar ciri yang menjauhi nol, yaitu sebesar 2,709. Keadaan ini dapat diartikan bahwa fungsi diskriminan yang diperoleh cukup baik karena tidak terjadi multikolinearitas di antara sesama peubah bebasnya.
canonical diskriminan

Pada tabel Eigen Value terdapat nilai canonical correlation. Canonical correlation digunakan untuk mengukur derajat hubunggan antara besarnya variabilitas yang mampu diterangkan oleh variabel independen terhadap variabel dependen. Dari tabel di atas, diperoleh nilai canonical correlation sebesar 0,855, bila dikuadratkan menjadi (0,855x0,855)=0,7310; artinya 73,10% varians dari variabel dependen dapat dijelaskan dari model diskriminan yang terbentuk

canonical discriminant function coefficients

Tabel canonical discriminant function coefficients menerangkan model diskriminan yang terbentuk, yaitu :

Y = -10,467 + 0,072IQ + 0,168Emosi + 0,076Perilaku + 0,047Harmonis.

Function at Group Centroid

group centroids

Group Centroid merupakan rata-rata nilai diskriminan dari tiap-tiap observasi di dalam masing-masing kelompok. Group Centroid untuk kelompok nakal menengah ke atas adalah sebesar -1,161, sedangkan untuk kelompok nakal ringan adalah sebesar 2,285. Ini berarti bahwa secara rata - rata skor diskriminan kedua kelompok berbeda cukup besar. Sehingga fungsi diskriminan yang diperoleh dapat membedakan secara baik kelompok yang ada.

Classification results

classification results
Tabel ini menggambarkan crosstabulasi antara model awal dengan pengklasifikasian model diskriminan. Terlihat ada 4 responden yang salah klasifikasi, yaitu 3 responden yang awalnya ada pada kelompok kenakalan menengah keatas kemudian diprediksi masuk dalam kelompok kenakalan ringan dan 1 responden yang awalnya ada pada kelompok kenakalan ringan kemudian diprediksi masuk dalam kelompok kenakalan menengah keatas. Secara keseluruhan model diskriminan yang terbentuk mempunyai tingkat validasi yang cukup tinggi yaitu 95,8%. Hasil survei di atas menunjukkan hasil keakuratan model diskriminan yang cukup tinggi.
Untuk materi tentang analisis diskriminan silahkan di klik Materi analisis diskriminan

.
Written by: Nasrul Setiawan
STATISTIK CERIA, Updated at: 3:06 AM

Mar 19, 2013

Konsep Teori Analisis Diskriminan

Prinsip Dasar analisis diskriminan

Analisis diskriminan adalah bagian dari analisis statistik peubah ganda (multivariate statistical analysis) yang bertujuan untuk memisahkan beberapa kelompok data yang sudah terkelompokkan dengan cara membentuk fungsi diskriminan. Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada hubungan dependensi (hubungan antar variabel dimana sudah bisa dibedakan mana variabel respon dan mana variabel penjelas). Lebih spesifik lagi, analisis diskriminan digunakan pada kasus dimana variabel respon berupa data kualitatif dan variabel penjelas berupa data kuantitatif.
Menurut Johnson and Wichern (1982 : 470), tujuan dari analisis disriminan adalah untuk menggambarkan ciri-ciri suatu pengamatan dari bermacam-macam populasi yang diketahui, baik secara grafis maupun aljabar dengan membentuk fungsi diskriminan. Dengan kata lain, analisis diskriminan digunakan untuk mengklasifikasikan individu ke dalam salah satu dari dua kelompok atau lebih.
jika dianalogikan dengan regresi linear, maka analisis diskriminan merupakan kebalikannya. pada regresi linear, variabel respon yang harus mengikuti distribusi normal dan homoskedastis, sedangkan variabel penjelas diasumsikan fixed, artinya variabel penjelas tidak disyaratkan mengikuti sebaran tertentu. untuk analisis diskriminan, variabel penjelasnya seperti sudah disebutkan di atas harus mengikuti distribusi normal dan homoskedastis sedangkan variabel responnya fixed.

Tujuan analisis diskriminan secara umum

  1. Mengetahui apakah ada perbedaan yang jelas antara kelompok pada variabel dependen. Bisa juga dikatakan untuk melihat perbedaan antara anggota grup 1 dengan grup 2.
  2. Jika ada perbedaan, untuk mengetahui variabel bebas mana yang membuat perbedaan tersebut.
  3. Membuat fungsi atau model diskriminan yang pada dasarnya mirip dengan persamaan regresi.
  4. Melakukan klasifikasi terhadap objek (dalam terminology spss disebut baris), dan untuk mengetahui apakah suatu objek termasuk pada grup 1 atau grup 2 atau lainnya.

Asumsi dan Sampel dalam analisis diskriminan

  1. Sejumlah p variabel independen harus berdistribusi normal.
  2. Matriks ragam-peragam variabel independen berukuran pxp pada kedua kelompok harus sama.
  3. Tidak ada korelasi antar variabel independen.
  4. Tidak terdapat data yang outlier pada variabel independen.
Menurut Hair et al. (1987 : 76), analisis diskriminan tidak terlalu sensitif dengan pelanggaran asumsi ini, kecuali pelanggarannya bersifat ekstrim. Dan Johnson and Wichern (1988: 472) mengatakan hal yang sama bahwa asumsi ini (kesamaan ragam-peragam) di dalam praktiknya sering dilanggar.

Tidak ada jumlah sampel yang ideal secara pasti pada analisis diskriminan. Pedoman yang bersifat umum menyatakan untuk setiap variabel independen terdapat 5-20 sampel. Dengan demikian, jika terdapat 6 variabel independen maka seharusnya terdapat minimal 6x5=30 sampel. Secara terminology spss, jika ada enam kolom variabel independen, sebaiknya ada 30 baris data.

Selain itu, pada analisis diskriminan sebaiknya digunakan dua jenis sampel, yakni analisis sampel yang digunakan untuk membuat fungsi diskriminan, serta holdout sampel (split sampel) yang digunakan untuk menguji hasil diskriminan.

Langkah-langkah dalam analisis diskriminan

  1. Memisah variabel-variabel menjadi variabel dependen dan variabel independen.
  2. Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya terdapat dua metode dasar untuk membuat fungsi diskriminan, yakni:
    • Simultaneus estimation, semua variabel independen dimasukkan secara bersama-sama kemudian dilakukan proses diskriminan.
    • Stepwise estimation, variabel independen dimasukkan satu per satu kedalam model diskriminan. Pada proses ini akan ada variabel yang tetap ada dalam model dan ada variabel yang dibuang dari model.
  3. Menguji signifikansi dari fungsi diskriminan yang telah terbentuk, menggunakan Wilk’s lamda, Pilai, F test dan uji lainnya.
  4. Menguji ketepatan klasifikasi dari fungsi diskriminan serta mengetahui ketepatan klasifikasi secara individual dengan casewise diagnostics.
  5. Melakukan interpretasi terhadap fungsi diskriminan tersebut.
  6. Melakukan uji validasi terhadap fungsi diskriminan.
Suatu fungsi diskriminan layak untuk dibentuk bila terdapat perbedaan nilai rataan di antara 2 kelompok yang ada. Oleh karena itu, sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap perbedaan vektor nilai rataan dari 2 kelompok tersebut. Dalam pengujian vektor nilai rataan antar kelompok, asumsi yang harus dipenuhi adalah peubah-peubah yang diamati berdistribusi multivariate normality dan semua kelompok populasi mempunyai matrik ragam-peragam yang sama.

Materi lengkapnya mungkin bisa didownlod di materi analisis diskriminan
Untuk Tutorial analisis diskriminan dengan spss silahkan klik [Tutorial] Analisis Diskriminan dengan SPSS
Written by: Nasrul Setiawan
STATISTIK CERIA, Updated at: 10:09 AM

Mar 10, 2013

[TUTORIAL] contoh kasus analisis faktor dengan SPSS

contoh kasus untuk analisis faktor

Berdasarkan SDKI 2002-2003 cakupan imunisasi lengkap anak usia 12-23 bulan di Indonesia berdasarkan informasi dari KMS (Kartu Menuju Sehat) atau laporan ibu sebesar 52 persen. Angka ini masih keci bilBerdasarkan SDKI 2002-2003 cakupan imunisasi lengkap anak usia 12-23 bulan di Indonesia berdasarkan informasi dari KMS (Kartu Menuju Sehat) atau laporan ibu sebesar 52 persen. Angka ini masih keci bila dibandingkan dengan 80 persen angka cakupan imunisasi lengkap yang ditargetkan oleh UCI ( Universal Chilhood Imunization). Bila dilihat pada cakupan imunisasi lengkap pada tingkat propinsi hanya ada dua propinsi yang telah memenuhi target UCI yaitu Yogyakarta (84 persen) dan Bali (80 persen). Oleh karena itu, ingin diketahui faktor dominan apakah yang mempengaruhi ketidaklengkapan imunisasi anak usia 12-23 bulan di Indonesia. Faktor dominan yang ingin diketahui pengaruhnya dibatasi pada karakteristik ibu dan ayah.


Sehingga inti dalam kasus ini yaitu ingin melihat Faktor – Faktor yang Mempengaruhi ketidaklengkapan Imunisasi Anak Usia 12 – 23 Bulan di Indonesia Tahun 2003. Data yang digunakan dalam kasus di atas berasal dari Survei Demografi dan Kesehetan Indonesia, 2002-2003. Silahkan lihat kalau coba-coba disini. data imunisasi

Langkah-langkah dalam Analisis faktor dengan SPSS

Menyamakan satuan data


  1. Buka data yang sudah dimasukkan. Tampilannya seperti berikut.
    data lengkap
  2. Karena data memiliki variasi yang besar (karena satuan dan rentang data yang berbeda-beda), maka distandardisasi terlebih dahulu dengan mentransformasikan ke dalam bentuk Z-score, yaitu dengan klik Descriptive StatisticsDescriptives. Maka akan muncul tampilan berikut.
    standardized value
  3. Pada kolom Variable(s) masukkan semua variabel, lalu centang pilihan ‘Save standardized values as variables’. Kemudian Pilih Menu Options maka akan muncul tampilan berikut.
    standardized option
  4. Beri tanda cek pada Mean, dengan pada Dispersion dicek Standard Deviation dan Variance, serta beri tanda cek pada Variable List pada Display Order. kemudian Klik Continue. Maka akan muncul variabel baru seperti berikut.
    hasil standardized

Melakukan Analisis Faktor


  1. Pilih Analyze >> Data Reduction >> Factor. Maka akan muncul jendela Factor Analysis
  2. Pilih semua variabel sebagai variabel analisis. Klik Descriptive, pada bagian Correlation Matrix beri tanda cek pada Coefficient,significan levels,  invers, Anti image dan KMO and Bartlett’s test of sphericity. Klik Continue.
    factor descriptive
  3. Kemudian klik pada Extraction dan pastikan pilihan Analyze pada correlation matrix dan pada bagian Display beri tanda cek pada kedua pilihan. Sebagai kriteria ekstaksi (Extraction) kita akan menggunakan eigenvalue, yaitu Eigenvalues over: 1. Klik Continue.
    factor extracrion
  4. Klik Rotation lalu pilih Varimax dan pada Display pilih Rotated Solution. Klik Continue
    factor varimax
  5. Klik Scores, lalu beri tanda cek Save as Variables dengan Method: Regression dan Display factor score coefficient matrix, agar kita bisa melihat nilai variabel/faktor baru yang terbentuk. Klik Continue.
    factor scores
  6. Setelah itu klik OK, akan muncul kumpulan output yang siap diinterpretasi.


Intrepretasi

Deskripsi

Deskripsi Data

Correlation Matrix

Tabel Correlation Matrix merupakan tabel matriks korelasi yang berisi nilai-nilai korelasi antara variabel-variabel yang akan dianalisis. Pada bagian Correlation dapat dilihat besarnya korelasi antarvariabel. Sebagai contoh, korelasi antara variabel ibu tinggal di desa dengan ibu yang bekerja sebesar -0,573 yang menunjukkan terdapat hubungan yang cukup kuat dan negative. Artinya, semakin banyak persentase ibu yang tinggal di desa, maka makin sedikit persentase ibu yang bekerja.
correlation matrix

Kemudian pada baris sig.(1-tailed) menunjukkan signifikansi korelasi antara variabel-variabel tersebut. Korelasi antara variabel ibu tinggal di desa dengan ibu yang bekerja signifikan, terlihat dari nilai p-value sebesar 0,001(<0.05) yang berarti terdapat memang terdapat hubungan antara variabel ibu tinggal di desa dengan variabel ibu yang bekerja.

Inverse of Correlation Matrix

Sedangkan table Inverse of Correlation Matrix menyatakan nilai-nilai pada matriks korelasi setelah matriks tersebut diinverskan.
inverse correlation
Catatan : Dalam kasus ini, digunakan matriks korelasi untuk keperluan analisis faktor sebab data yang digunakan memiliki satuan yang berbeda-beda,sehingga distandarisasi menggunakan matriks korelasi untuk menghilangkan bias.

Analisis Inferensia

KMO dan Bartlett’s Test

kmo bartlett test
Berdasarkan Bartlett’s Tes of Sphericity dengan Chi-Square 94,304 (df 45) dan nilai sig = 0,000 < 0,05 menunjukkan bahwa matriks korelasi bukan merupakan matriks identitas sehingga dapat dilakukan analisis komponen utama. Di samping itu, Nilai KMO yang dihasilkan adalah sebesar 0.574 serta p-value sebesar 0,000 (<0,05) , nilai tersebut jatuh dalam kategori “lebih dari cukup” layak untuk kepentingan analisis faktor. Oleh karena itu, variabel – variabel dapat dianalisis lebih lanjut (AA Afifi,1990:Dillon dan Goldstein,1984).

Tabel Anti-Image Matrices

anti image matrics
Selain pengecekan terhadap KMO and Bartlett test, dilakukan juga pengecekan Anti Image matrices untuk mengetahui apakah variabel – variabel secara parsial layak untuk dianalisis dan tidak dikeluarkan dalam pengujian. Berdasarkan tabel di atas, terlihat bahwa dari sepuluh variabel yang akan dianalisis, terdapat dua variabel yang memiliki nilai MSA (dapat dilihat pada output yang bertanda a pada kolom Anti-Image Correlation) < 0,5 yaitu variabel ibu tidak bekerja dan variabel bapak yang tidak bekerja. Karena ada variabel yang nilai MSA nya < 0,5 , maka variabel tersebut tidak dapat dianalisis lebih lanjut. Meskipun ada dua variabel yang nilai MSA nya < 0,5, namun kita tidak harus membuang dua variabel sekaligu. Pilih salah satu variabel yang memiliki MSA terkecil, yaitu bapak tidak bekerja sebesar 0,360 sehingga variabel tersebut dikeluarkan dan dilakukan pengujian ulang terhadap kesembilan variabel lainnya seperti pada cara di atas.
kmo bartlett

Setelah variabel bapak tidak bekerja dikeluarkan, maka nilai KMO meningkat menjadi 0,652 dan tingkat signifikansi 0,000.Pengurangan variabel yang “tidak layak” meningkatkan nilai KMO sehingga cukup beralasan untuk melakukan pengurangan tersebut Hal ini dapat menunjukkan bahwa kesembilan variabel tersebut’ lebih dari cukup’ layak untuk dilakukan analisis faktor.

Communalities

Dari keseluruhan nilai dalam table communalities, diperoleh bahwa kesembilan variabel awal mempunyai nilai communalities yang besar ( > 0.5). Hal ini dapat diartikan bahwa keseluruhan variabel yang digunakan memiliki hubungan yang kuat dengan faktor yang terbentuk. Dengan kata lain, semakin besar nilai dari communalities maka semakin baik analisis faktor, karena semakin besar karakteristik variabel asal yang dapat diwakili oleh faktor yang terbentuk.
communalities

  1. Keeratan hubungan variabel ibu bekerja terhadap faktor yang terbentuk sebesar 0,811 artinya hubungan variabel ibu bekerja terhadap faktor yang terbentuk erat. Atau dapat juga dikatakan kontribusi variabel ibu bekerja terhadap faktor yang terbentuk sebesar 81,1 %.
  2. Kemudian, keeratan hubungan variabel bapak yang pendidikannya SD ke bawah sebesar 0,849 artinya hubungan variabel bapak yang pendidikannya SD ke bawah terhadap faktor yang terbentuk erat. Atau dapat juga dikatakan kontribusi variabel variabel bapak yang pendidikannya SD ke bawah terhadap faktor yang terbentuk sebesar 84,9 %.

Total Variance Explained

Table Total Variance Explained menunjukkan besarnya persentase keragaman total yang mampu diterangkan oleh keragaman faktor - faktor yang terbentuk. Dalam tabel tersebut juga terdapat nilai eigenvalue dari tiap-tiap faktor yang terbentuk. Faktor 1 memiliki eigenvalue sebesar 2,991, Faktor 2 sebesar 2,120, dan Faktor 3 sebesar 1,323. Untuk menentukan berapa komponen/faktor yang dipakai agar dapat menjelaskan keragaman total maka dilihat dari besar nilai eigenvaluenya, komponen dengan eigenvalue >1 adalah komponen yang dipakai. Kolom ‘cumulative %’ menunjukkan persentase kumulatif varians yang dapat dijelaskan oleh faktor. Besarnya keragaman yang mampu diterangkan oleh Faktor 1 sebesar 33,233 persen, sedangkan keragaman yang mampu dijelaskan oleh Faktor 1 dan 2 sebesar 56,787 persen. Ketiga faktor mampu menjelaskan keragaman total sebesar 71,485 persen. Berdasarkan alasan nilai eigen value ketiga faktor yang lebih dari 1 dan besarnya persentase kumulatif ketiga faktor sebesar 71,485 persen, dapat disimpulkan bahwa ketiga faktor sudah cukup mewakili keragaman variabel – variabel asal.
total variance explained
Proporsi keragaman data yang dijelaskan tiap komponen setelah dilakukan rotasi terlihat lebih merata daripada sebelum dilakukan rotasi. Faktor pertama menerangkan keragaman data dengan proporsi terbesar, yaitu 33,233 persen menurut metode ekstraksi dengan analisis faktor (sebelum rotasi) dan dengan analisis faktor (setelah rotasi) keragaman data awal dapat dijelaskan sebesar 26,841 persen. Kemudian untuk faktor kedua menerangkan keragaman data awal dengan proporsi 23,554 persen menurut metode ekstraksi dengan analisis faktor (sebelum rotasi) dan dengan analisis faktor (setelah rotasi) keragaman data awal dapat dijelaskan sebesar 26,315 persen. Sedangkan untuk faktor ketiga menerangkan keragaman sebesar 14,698 persen sebelum dilakukan rotasi dan naik menjadi 18,328 persen setelah dirotasi.
Proporsi keragaman data yang lebih merata setelah dilakukan rotasi menunjukkan keseragaman data awal yang dijelaskan oleh masing-masing faktor menjadi maksimum.

Scree Plot

scree plot
Scree Plot adalah salah satu alternatif yang dapat digunakan untuk membantu peneliti menentukan berapa banyak faktor terbentuk yang dapat mewakili keragaman peubah – peubah asal. Bila kurva masih curam, akan nada petunjuk untuh menambahkan komponen. Bila kurva sudah landai, akan ada petunjuk untuk menghentikan penambahan komponen, walaupun penilaian curam/landai bersifat subjektif peneliti. Dari scree plot di atas, terlihat pada saat satu komponen terbentuk, kurva masih menunjukkan kecuraman, begitu juga pada saat di titik ke-2, garis kurva masih tajam, di titik ke-3 garis kurva masih tajam namun sedikit berbeda dari pola kedua garis sebelumnya. Setelah melewati titik ke-3, garis kurva sudah mulai landai, semakin ke kanan akan semakin landai. Dari penjelasan di atas, dapat kita tarik kesimpulan bahwa terdapat tiga komponen atau faktor yang terbentuk.

Table component matrix 

component matrix
Table component matrix menunjukkan besarnya korelasi tiap variabel dalam faktor yang terbentuk. Nilai – nilai koefisien korelasi antara variabel dengan faktor - faktor yang terbentuk (loading factor) dapat dilihat pada table Component Matrix. Ketiga faktor tersebut menghasilkan matrik loading faktor yang nilai-nilainya merupakan koefisien korelasi antara variabel dengan faktor-faktor tersebut. Bila dilihat variabel –variabel yang berkorelasi terhadap setiap faktornya, ternyata loading faktor yang dihasilkan belum mampu memberikan arti sebagaimana yang diharapkan. Hal ini terlihat dari variabel ibu yang tidak punya KMS dimana korelasi variabel ini dengan faktor 1 sebesar 0,609, sedangkan dengan faktor 2 sebesar -0,508 (tanda negative hanya menunjukkan arah korelasi), sehingga kita sulit untuk memutuskan apakah variabel ibu tidak punya KMS dimasukkan ke faktor 1 atau faktor 2. Tiap faktor belum dapat diinterpretasikan dengan jelas sehingga perlu dilakukan rotasi dengan metode varimax. Rotasi varimax adalah rotasi orthogonal yang membuat jumlah varian faktor loading dalam masing-masing faktor akan menjadi maksimum, dimana nantinya peubah asal hanya akan mempunyai korelasi yang tinggi dan kuat dengan faktor tertentu saja (korelasinya mendekati 1) dan tentunya memiliki korelasi yang lemah dengan faktor yang lainnya (korelasinya mendekati 0). Hal yang demikian belum tercapai pada table component matrix diatas.

Rotated Component Matrix

rotated component matrix
Setelah dilakukan rotasi faktor dengan metode varimax, diperoleh table seperti yang tertera di atas yaitu Rotated Component Matrix. Terdapat perbedaan nilai korelasi variabel dengan setiap faktor sebelum dan sesudah dilakukan rotasi varimax. Terlihat bahwa loading faktor yang dirotasi telah memberikan arti sebagaimana yang diharapkan dan setiap faktor sudah dapat diinterpretasikan dengan jelas. Terlihat pula bahwa setiap variabel hanya berkorelasi kuat dengan salah satu faktor saja (tidak ada variabel yang korelasinya < 0,5 di ketiga faktor). Dengan demikian, lebih tepat digunakan loading faktor yang telah dirotasi sebab setiap faktor sudah dapat menjelaskan keragaman variabel awal dengan tepat dan hasilnya adalah sebagai berikut

  1. Faktor 1 , beberapa variabel yang memiliki korelasi yang kuat dengan faktor 1 , yaitu variabel ibu yang tinggal di desa, ibu yang mengakses koran, ibu yang bekerja dan urutan anak.
  2. Faktor 2, terdapat beberapa variabel yang memiliki korelasi yang kuat dengan faktor 2 , yaitu variabel ibu yang mengakses radio, ibu yang mengakses TV, ibu yang tidak punya KMS, dan bapak yang pendidikannya SD ke bawah.
  3. Faktor 3, dalam faktor ini tiga variabel yang memiliki korelasi yang kuat dengan faktor 3, yaitu variabel ibu yang pendidikannya SD ke bawah.

Component Transformation Matrix

component transformation matrix
Tabel Component Transformation Matrix berfungsi untuk menunjukkan apakah faktor – faktor yang terbentuk sudah tidak memiliki korelasi lagi satu sama lain atau orthogonal. Bila dilihat dari table Component Transformation Matrix, nilai – nilai korelasi yang terdapat pada diagonal utama berada di atas 0,5 yaitu -0,606;0,614;0,891. Hal ini menunjukkan bahwa ketiga faktor yang terbentuk sudah tepat karena memiliki korelasi yang tinggi pada diagonal – diagonal utamanya.
Untuk lengkapnya bisa didownload disini beserta intrepretasi ouputnya Tutorial contoh analisis faktor beserta hasil intrepretasi dengan SPSS

Untuk sedikit materi analisis faktor bisa dilihat disini gan. teori analisis faktor


Written by: Nasrul Setiawan
STATISTIK CERIA, Updated at: 3:41 AM

Mar 9, 2013

Teori Analisis faktor (Factor Analysis)

KONSEP ANALISIS FAKTOR


Analisis faktor adalah salah satu teknik statistika yang dapat digunakan untuk memberiikan deskripsi yang relatif sederhana melalui reduksi jumlah peubah yang disebut faktor. Analisis faktor adalah prosedur untuk mengidentifikasi item atau variabel berdasarkan kemiripannya. Kemiripan tersebut ditunjukkan dengan nilai korelasi yang tinggi. Item-item yang memiliki korelasi yang tinggi akan membentuk satu kerumunan faktor.Prinsip dasar dalam analisis faktor adalah menyederhanakan deskripsi tentang data dengan mengurangi jumlah variabel/ dimensi.


Analisis faktor memungkinkan peneliti untuk:

  1. Menguji ketepatan model (goodness of fit test) faktor yang terbentuk dari item-item alat ukur.
  2. Menguji kesetaraan unit pengukuran antar item,
  3. Menguji reliabilitas item-item pada tiap faktor yang diukur,
  4. Menguji adanya invarian item pada populasi.

JENIS ANALISIS FAKTOR

a) Analisis Faktor Eksploratori (Exploratory Factor Analysis)

Seorang peneliti membuat seperangkat item yang mengukur kualitas pelayanan bank. Item tersebut merupakan operasionalisasi dari teori dan indikator mengenai kualitas layanan. Peneliti hendak mengidentifikasi berapa faktor yang ada di dalam seperangkat item tersebut. Dari analisis faktor kemudian didapatkan ada 4 faktor yang menggambarkan kualitas layanan bank, antara lain faktor fitur layanan, fasilitas gedung, keramahan karyawan, serta jaminan keamanan.

b) Analisis Faktor Konfirmatori (Confirmatory Factor Analysis).

Seorang peneliti merancang sebuah alat ukur mengenai dukungan sosial. Alat ukur tersebut berisi seperangkat aitem yang diturunkan dari lima dimensi dukungan sosial. Peneliti berusaha memastikan apakah alat ukur yang dibuatnya benar-benar menjelaskan kelima dimensi tersebut. Ia kemudian melakukan analisis faktor konfirmatori. Hasil dari analisis faktor menunjukkan bahwa pembagian kelima faktor akhirnya dibuktikan.


FUNGSI ANALISIS FAKTOR

Analisis faktor memiliki fungsi penting dalam pengembangan alat ukur. Beberapa fungsi tersebut antara lain sebagai berikut.

a) Pengujian Dimensionalitas Pengukuran

Dimensionalitas pengukuran adalah banyaknya atribut yang diukur oleh sebuah alat ukur. Alat ukur yang unidimensi mengukur satu atribut psikologis saja sedangkan alat ukur yang multidimensi mengukur lebih dari satu atribut ukur. Pengukuran dalam bidang psikologi didominasi oleh pengukuran unidimensi karena alat ukur yang dikembangkan peneliti psikologi biasanya mengukur satu target ukur saja. Misalnya Skala Kecemasan, skala ini diharapkan mengukur atribut kecemasan saja dan tidak mengukur atribut yang lain. Untuk mengetahui apakah alat ukur yang dikembangkan oleh peneliti mengukur satu atribut atau banyak atribut diperlukan analisis faktor.

b) Pengujian Komponen atau Aspek dalam Alat Ukur

Penyusunan alat ukur psikologi biasanya diawali dari penurunan konsep menjadi komponen atau aspek konsep sebelum diturunkan menjadi aitem berupa pernyataan skala. Untuk mengidentifikasi apakah item-item yang diturunkan dari komponen alat ukur mewakili komponen tersebut maka diperlukan analisis faktor. Analisis faktor juga dapat menunjukkan apakah antar komponen memiliki keterkaitan ataukah tidak (independen).


LANGKAH-LANGKAH MELAKUKAN ANALISIS FAKTOR

1. Melakukan uji korelasi antar variabel asal dengan tujuan agar penyusutan variabel analisis faktor menjadi lebih sederhana dan bermanfaat, tanpa kehilangan banyak informasi sebelumnya.

2. Uji kelayakan data (menggunakan basis faktor) apakah cocok dilakukan analisis faktor.

3. Mencari akar ciri dan matriks Σ atau R.

4. Mengurutkan akar ciiri yang terbentuk dari terbesar sampai terkecil.

5. Mencari proporsi keragaman atau berguna untuk mengetahui berapa faktor yang akan terbentuk.

6. Mengalokasikan setiap variabel asal kedalam faktor sesuai dengan nilai loading.

7. Apabila terdapat nilai loading yang identik atau hampir sama maka lakukan rotasi baik dengan cara orthogonal ataupun non orthogonal.

8. Setelah yakin dengan faktor yang terbentuk , maka berikan penamaan pada faktor tersebut dengan cara melihat variabel-variabel apa saja yang menyusun faktor tersebut.


MENENTUKAN METODE ANALISIS FAKTOR

Terdapat dua cara yang dapat dipergunakan dalam analisis faktor khususnya koefisien skor faktor, yaitu Principal component dan Common factor analysis.

1. Principal component

Jumlah varian dalam data dipertimbangkan. Diagonal matrik korelasi terdiri dari angka satu dan full variance dibawa dalam matriks faktor. Principal component direkomendasikan jika hal yang pokok adalah menentukan bahwa banyaknya faktor harus minimum dengan memperhitungkan varians maksimum dalam data untuk dipergunakan di dalam analysis multivariate lebih lanjut.

2. Common factor analysis

Faktor diestimasi hanya didasarkan pada common variance, communalities dimasukkan dalam matrik korelasi. Metode ini dianggap tepat jika tujuan utamanya mengenali/mengidentifikasi dimensi yang mendasari dan common variance yang menarik perhatian.



PENENTUAN BANYAKNYA FAKTOR


Maksud melakukan analysis faktor adalah mencari variable baru yang disebut faktor yang tidak saling berkorelasi, bebas satu sama lain, lebih sedikit dari variable asli, tapi dapat menyerap sebagian besar informasi yang terkandung dalam variable asli atau yang dapat memberikan sumbangan terhadap varian seluruh variable. Lalu berapa faktor yang perlu disajikan? Ada beberapa cara;

1. Penentuan Apriori

Kadang karena peneliti sebelumnya sudah mengetahui berapa faktor yang digunakan maka kita akan menentukan dulu berapa faktor yang akan digunakan.

2. Penentuan Berdasar Eigenvalue

Faktor dengan eigenvalue lebih besar dari satu yang dipertahankan jika lebih kecil dari satu faktornya tidak diikutsertakan dalam model. Suatu eigenvalue menunjukkan besar sumbangan dari faktor terhadap varian seluruh variable asli. Hanya faktor dengan varian lebih dari 1 yang dimasukkan dalam model. Faktor dengan varian kurang dari 1 tidak baik karena variable asli telah dibakukan yang berarti rata-ratanya 0 dan variansnya 1. Bila banyak variable asli asli kurang dari 20 pendekatan ini menghasilkan sejumlah faktor yang konservatif.

3. Penentuan Berdasar Screeplot

Dapat dilihat dari grafik screeplot dimana scree mulai terjadi menunjukkan banyak faktor yang benar, tepatnya ketika scree mulai mendatar. Kenyataan menunjukkan bahwa penentuan banyaknya faktor dengan screeplot akan mencapai satu atau lebih banyak dari penentuan dengan eigenvalue.

4. Penentuan Didasarkan pada Presentase Varian

Banyak faktor diekstraksi ditentukan sedemikian rupa sehingga kumulatif presentase varian yang diekstraksi oleh faktor mancapai suatu level tertentu yang memuaskan. Ekstraksi faktor dihentikan jika kumulatif presentase varian sudah mencapai paling sedikit 60% atau 75% dari seluruh varian variable asli.

Untuk materi lengkapnya bisa didownload di Materi Lengkap Analisis Faktor.Untuk Tutorial faktor dengan SPSS di [TUTORIAL] contoh kasus analisis faktor dengan SPSS.
Written by: Nasrul Setiawan
STATISTIK CERIA, Updated at: 7:21 AM

 

Copyright @ 2013 Statistik Ceria

close