Thursday, March 21, 2013

[Tutorial] Analisis Diskriminan dengan SPSS

Thursday, March 21, 2013
0 comments
Suatu penelitian ingin mengetahui karakteristik sosial demografi yang dapat membedakan antar kelompok anak berdasarkan level kenakalannya di PSMP Handayani dan BRSMP Harapan dan ingin mengetahui karakteristik sosial dan demografi anak nakal tersebut berdasarkan jenis kenakalan yang dilakukan oleh anak yang dibina di PSMP Handayani dan BRSMP Harapan. Maka analisis yang digunakan dalam penelitian tersebut adalah analisis diskriminan.

tutorial analisis diskriminan spss

Variabel independennya:

X1: Kenakalan
X2: Nilai tes IQ
X3: Kecerdasan Emosional
X4: Perilaku sebelum masuk panti
X5: Keharmonisan keluarga
X6: Pendidikan Anak
X7: Rata-rata Lama Bermain
X8: Umur Anak
X9: Jumlah Anggota rumah tangga
X10: Jumlah Bersaudara Kandung
X11: Pendidikan Pengasuh

Variabel dependen:
Y: Tingkat Kenakalan : (Nakal menengah keatas dan Nakal Ringan)

Berikut Langkah-langkah dalam analisis diskriminan:


1. Masukkan data yang akan diolah.


tutorial analisis diskriminan spss


2. Pada menu Analyze, pilih submenu Classsify, lalu pilih Discriminant.


tutorial analisis diskriminan spss




3. Pada kotak dialog Discriminant Analysis, pindahkan Nakal_Rev2 ke dalam Grouping Variable, lalu klik Define Range.

tutorial analisis diskriminan spss



4. Lalu pada kotak kecil, bagian minimum diisi dengan kode terkecil dan maximum diisi dengan kode terbesar dari variabel respon, pada contoh kasus disini,masukkan angka “1” untuk minimum dan “2” untuk maximum. Kemudian klik Continue.

tutorial analisis diskriminan spss



5. Kembali ke kotak dialog Discriminant Analysis, lalu pada Independents diisi dengan variabel penjelas. Metode yang sering dipaparkan pada literatur-literatur adalah metode bertatar (stepwise), maka kali ini hanya akan diberi contoh penggunaan metode ini. Pada contoh kasus di sini, variabel independents adalah variabel yang tersisa tadi. Kemudian pindahkan variable yang tersisa ke dalam Independents.lalu, pilih dan klik Statistics.

tutorial analisis diskriminan spss



6. Pada kotak kecil, centangkan kotak means, univariate ANOVA’s, Box’s M, serta Unstandardized. Lalu, Continue.

tutorial analisis diskriminan spss



7. Kembali ke kotak dialog Discriminant Analysis, lalu pada Classification, lalu diberi tanda cek di All group equal, Casewise result, Summary table, dan Within-groups. Lalu, klik Continue.

tutorial analisis diskriminan spss



Setelah melakukan hal diatas maka langkah selanjutnya adalah intrepretasikan dari output SPSS tersebut.
Mohon maaf karena untuk intrepretasi outputnya tidak dicantumkan di sini karena terlalu panjang intrepretasi outputnya. Teman-teman bisa download Tutorial lengkap analisis diskriminan dengan SPSS (PDF).


read more


Tuesday, March 19, 2013

Konsep Teori Analisis Diskriminan

Tuesday, March 19, 2013
0 comments
analisis diskriminan spss

Prinsip Dasar


Analisis diskriminan adalah bagian dari analisis statistik peubah ganda (multivariate statistical analysis) yang bertujuan untuk memisahkan beberapa kelompok data yang sudah terkelompokkan dengan cara membentuk fungsi diskriminan. Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada hubungan dependensi (hubungan antar variabel dimana sudah bisa dibedakan mana variabel respon dan mana variabel penjelas). Lebih spesifik lagi, analisis diskriminan digunakan pada kasus dimana variabel respon berupa data kualitatif dan variabel penjelas berupa data kuantitatif.


Menurut Johnson and Wichern (1982 : 470), tujuan dari analisis disriminan adalah untuk menggambarkan ciri-ciri suatu pengamatan dari bermacam-macam populasi yang diketahui, baik secara grafis maupun aljabar dengan membentuk fungsi diskriminan. Dengan kata lain, analisis diskriminan digunakan untuk mengklasifikasikan individu ke dalam salah satu dari dua kelompok atau lebih.

jika dianalogikan dengan regresi linear, maka analisis diskriminan merupakan kebalikannya. pada regresi linear, variabel respon yang harus mengikuti distribusi normal dan homoskedastis, sedangkan variabel penjelas diasumsikan fixed, artinya variabel penjelas tidak disyaratkan mengikuti sebaran tertentu. untuk analisis diskriminan, variabel penjelasnya seperti sudah disebutkan di atas harus mengikuti distribusi normal dan homoskedastis sedangkan variabel responnya fixed.

Tujuan diskriminan secara umum


  1. Mengetahui apakah ada perbedaan yang jelas antara kelompok pada variabel dependen. Bisa juga dikatakan untuk melihat perbedaan antara anggota grup 1 dengan grup 2.
  2. Jika ada perbedaan, untuk mengetahui variabel bebas mana yang membuat perbedaan tersebut.
  3. Membuat fungsi atau model diskriminan yang pada dasarnya mirip dengan persamaan regresi.
  4. Melakukan klasifikasi terhadap objek (dalam terminology spss disebut baris), dan untuk mengetahui apakah suatu objek termasuk pada grup 1 atau grup 2 atau lainnya.

Asumsi dan Sampel



1. Sejumlah p variabel independen harus berdistribusi normal.

2. Matriks ragam-peragam variabel independen berukuran pxp pada kedua kelompok harus sama.

3. Tidak ada korelasi antar variabel independen.

4. Tidak terdapat data yang outlier pada variabel independen.

Menurut Hair et al. (1987 : 76), analisis diskriminan tidak terlalu sensitif dengan pelanggaran asumsi ini, kecuali pelanggarannya bersifat ekstrim. Dan Johnson and Wichern (1988: 472) mengatakan hal yang sama bahwa asumsi ini (kesamaan ragam-peragam) di dalam praktiknya sering dilanggar.

Tidak ada jumlah sampel yang ideal secara pasti pada analisis diskriminan. Pedoman yang bersifat umum menyatakan untuk setiap variabel independen terdapat 5-20 sampel. Dengan demikian, jika terdapat 6 variabel independen maka seharusnya terdapat minimal 6x5=30 sampel. Secara terminology spss, jika ada enam kolom variabel independen, sebaiknya ada 30 baris data.

Selain itu, pada analisis diskriminan sebaiknya digunakan dua jenis sampel, yakni analisis sampel yang digunakan untuk membuat fungsi diskriminan, serta holdout sampel (split sampel) yang digunakan untuk menguji hasil diskriminan.

PROSEDUR ANALISIS


Berikut adalah prooses untuk melakukan analisis diskriminan:

1. Memisah variabel-variabel menjadi variabel dependen dan variabel independen.

2. Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya terdapat dua metode dasar untuk membuat fungsi diskriminan, yakni:

Ø Simultaneus estimation, semua variabel independen dimasukkan secara bersama-sama kemudian dilakukan proses diskriminan.

Ø Stepwise estimation, variabel independen dimasukkan satu per satu kedalam model diskriminan. Pada proses ini akan ada variabel yang tetap ada dalam model dan ada variabel yang dibuang dari model.

3. Menguji signifikansi dari fungsi diskriminan yang telah terbentuk, menggunganan Wilk’s lamda, Pilai, F test dan lainnya.

4. Menguji ketepatan klasifikasi dari fungsi diskriminan serta mengetahui ketepatan klasifikasi secara individual dengan casewise diagnostics.

5. Melakukan interpretasi terhadap fungsi diskriminan tersebut.

6. Melakukan uji validasi terhadap fungsi diskriminan.


Suatu fungsi diskriminan layak untuk dibentuk bila terdapat perbedaan nilai rataan di antara 2 kelompok yang ada. Oleh karena itu, sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap perbedaan vektor nilai rataan dari 2 kelompok tersebut. Dalam pengujian vektor nilai rataan antar kelompok, asumsi yang harus dipenuhi adalah peubah-peubah yang diamati berdistribusi multivariate normality dan semua kelompok populasi mempunyai matrik ragam-peragam yang sama.

Materi lengkapnya mungkin bisa didownlod di materi agak lengkap

read more


Sunday, March 10, 2013

[TUTORIAL] contoh kasus analisis faktor dengan SPSS

Sunday, March 10, 2013
4 comments
contoh kasus untuk analisis faktor

Berdasarkan SDKI 2002-2003 cakupan imunisasi lengkap anak usia 12-23 bulan di Indonesia berdasarkan informasi dari KMS (Kartu Menuju Sehat) atau laporan ibu sebesar 52 persen. Angka ini masih keci bilBerdasarkan SDKI 2002-2003 cakupan imunisasi lengkap anak usia 12-23 bulan di Indonesia berdasarkan informasi dari KMS (Kartu Menuju Sehat) atau laporan ibu sebesar 52 persen. Angka ini masih keci bila dibandingkan dengan 80 persen angka cakupan imunisasi lengkap yang ditargetkan oleh UCI ( Universal Chilhood Imunization). Bila dilihat pada cakupan imunisasi lengkap pada tingkat propinsi hanya ada dua propinsi yang telah memenuhi target UCI yaitu Yogyakarta (84 persen) dan Bali (80 persen). Oleh karena itu, ingin diketahui faktor dominan apakah yang mempengaruhi ketidaklengkapan imunisasi anak usia 12-23 bulan di Indonesia. Faktor dominan yang ingin diketahui pengaruhnya dibatasi pada karakteristik ibu dan ayah.


Sehingga inti dalam kasus ini yaitu ingin melihat Faktor – Faktor yang Mempengaruhi Ketidaklengkapan Imunisasi Anak Usia 12 – 23 Bulan di Indonesia Tahun 2003

Berikut data yang digunakan dalam kasus di atas.

tutorial analisis faktor spss
Sumber : Survei Demografi dan Kesehetan Indonesia, 2002-2003

Langkah-langkah dalam Analisis faktor dengan SPSS

1. Buka data yang sudah dimasukkan

tutorial analisis faktor spss

Karena data memiliki variasi yang besar (karena satuan dan rentang data yang berbeda-beda), maka distandardisasi terlebih dahulu dengan mentransformasikan ke dalam bentuk Z-score, yaitu dengan klik Descriptive StatisticsDescriptives.

tutorial analisis faktor spss

2. Setelah itu,pada kolom Variable(s) masukkan keenam variabel, lalu centang pilihan ‘Save standardized values as variables’→Pilih Menu Options

tutorial analisis faktor spss


Beri tanda cek pada Mean, dengan Dispersion Standard Deviation dan Variance, serta beri tanda cek pada Variable List pada Display Order→Klik Continue.

tutorial analisis faktor spss

Kemudian, dari menu pilih AnalyzeData Reduction Factor

tutorial analisis faktor spss

Maka akan muncul jendela Factor Analysis


tutorial analisis faktor spss

Pilih kesepuluh variabel sebagai variabel analisis.

Klik Descriptive, pada bagian Correlation Matrix beri tanda cek pada Coefficient,significan levels, determinant, invers dan KMO and Bartlett’s test of sphericity. Klik Continue.

tutorial analisis faktor spss

Kemudian klik pada Extraction dan pastikan pilihan Analyze pada correlation matrix dan pada bagian Display beri tanda cek pada kedua pilihan. Sebagai kriteria ekstaksi (Extraction) kita akan menggunakan eigenvalue, yaitu Eigenvalues over: 1. Klik Continue.


tutorial analisis faktor spss

Klik Rotation lalu pilih Varimax dan pada Display pilih Rotated Solution. Klik Continue


tutorial analisis faktor spss


Klik Scores, lalu beri tanda cek Save as Variables dengan Method: Regression dan Display factor score coefficient matrix, agar kita bisa melihat nilai variabel/faktor baru yang terbentuk. Klik Continue.


tutorial analisis faktor spss


Setelah itu klik OK, akan muncul kumpulan output yang siap diinterpretasi.


Untuk lengkapnya bisa didownload disini beserta intrepretasi ouputnya Tutorial contoh analisis faktor beserta hasil intrepretasi dengan SPSS

Untuk sedikit materi analisis faktor bisa dilihat disini gan. teori analisis faktor



read more


Saturday, March 9, 2013

Teori Analisis faktor (Factor Analysis)

Saturday, March 9, 2013
0 comments

KONSEP ANALISIS FAKTOR


Analisis faktor adalah salah satu teknik statistika yang dapat digunakan untuk memberiikan deskripsi yang relatif sederhana melalui reduksi jumlah peubah yang disebut faktor. Analisis faktor adalah prosedur untuk mengidentifikasi item atau variabel berdasarkan kemiripannya. Kemiripan tersebut ditunjukkan dengan nilai korelasi yang tinggi. Item-item yang memiliki korelasi yang tinggi akan membentuk satu kerumunan faktor.Prinsip dasar dalam analisis faktor adalah menyederhanakan deskripsi tentang data dengan mengurangi jumlah variabel/ dimensi.


Analisis faktor memungkinkan peneliti untuk:

  1. Menguji ketepatan model (goodness of fit test) faktor yang terbentuk dari item-item alat ukur.
  2. Menguji kesetaraan unit pengukuran antar item,
  3. Menguji reliabilitas item-item pada tiap faktor yang diukur,
  4. Menguji adanya invarian item pada populasi.

JENIS ANALISIS FAKTOR

a) Analisis Faktor Eksploratori (Exploratory Factor Analysis)

Seorang peneliti membuat seperangkat item yang mengukur kualitas pelayanan bank. Item tersebut merupakan operasionalisasi dari teori dan indikator mengenai kualitas layanan. Peneliti hendak mengidentifikasi berapa faktor yang ada di dalam seperangkat item tersebut. Dari analisis faktor kemudian didapatkan ada 4 faktor yang menggambarkan kualitas layanan bank, antara lain faktor fitur layanan, fasilitas gedung, keramahan karyawan, serta jaminan keamanan.

b) Analisis Faktor Konfirmatori (Confirmatory Factor Analysis).

Seorang peneliti merancang sebuah alat ukur mengenai dukungan sosial. Alat ukur tersebut berisi seperangkat aitem yang diturunkan dari lima dimensi dukungan sosial. Peneliti berusaha memastikan apakah alat ukur yang dibuatnya benar-benar menjelaskan kelima dimensi tersebut. Ia kemudian melakukan analisis faktor konfirmatori. Hasil dari analisis faktor menunjukkan bahwa pembagian kelima faktor akhirnya dibuktikan.


FUNGSI ANALISIS FAKTOR

Analisis faktor memiliki fungsi penting dalam pengembangan alat ukur. Beberapa fungsi tersebut antara lain sebagai berikut.

a) Pengujian Dimensionalitas Pengukuran

Dimensionalitas pengukuran adalah banyaknya atribut yang diukur oleh sebuah alat ukur. Alat ukur yang unidimensi mengukur satu atribut psikologis saja sedangkan alat ukur yang multidimensi mengukur lebih dari satu atribut ukur. Pengukuran dalam bidang psikologi didominasi oleh pengukuran unidimensi karena alat ukur yang dikembangkan peneliti psikologi biasanya mengukur satu target ukur saja. Misalnya Skala Kecemasan, skala ini diharapkan mengukur atribut kecemasan saja dan tidak mengukur atribut yang lain. Untuk mengetahui apakah alat ukur yang dikembangkan oleh peneliti mengukur satu atribut atau banyak atribut diperlukan analisis faktor.

b) Pengujian Komponen atau Aspek dalam Alat Ukur

Penyusunan alat ukur psikologi biasanya diawali dari penurunan konsep menjadi komponen atau aspek konsep sebelum diturunkan menjadi aitem berupa pernyataan skala. Untuk mengidentifikasi apakah item-item yang diturunkan dari komponen alat ukur mewakili komponen tersebut maka diperlukan analisis faktor. Analisis faktor juga dapat menunjukkan apakah antar komponen memiliki keterkaitan ataukah tidak (independen).


LANGKAH-LANGKAH MELAKUKAN ANALISIS FAKTOR

1. Melakukan uji korelasi antar variabel asal dengan tujuan agar penyusutan variabel analisis faktor menjadi lebih sederhana dan bermanfaat, tanpa kehilangan banyak informasi sebelumnya.

2. Uji kelayakan data (menggunakan basis faktor) apakah cocok dilakukan analisis faktor.

3. Mencari akar ciri dan matriks Σ atau R.

4. Mengurutkan akar ciiri yang terbentuk dari terbesar sampai terkecil.

5. Mencari proporsi keragaman atau berguna untuk mengetahui berapa faktor yang akan terbentuk.

6. Mengalokasikan setiap variabel asal kedalam faktor sesuai dengan nilai loading.

7. Apabila terdapat nilai loading yang identik atau hampir sama maka lakukan rotasi baik dengan cara orthogonal ataupun non orthogonal.

8. Setelah yakin dengan faktor yang terbentuk , maka berikan penamaan pada faktor tersebut dengan cara melihat variabel-variabel apa saja yang menyusun faktor tersebut.


MENENTUKAN METODE ANALISIS FAKTOR

Terdapat dua cara yang dapat dipergunakan dalam analisis faktor khususnya koefisien skor faktor, yaitu Principal component dan Common factor analysis.

1. Principal component

Jumlah varian dalam data dipertimbangkan. Diagonal matrik korelasi terdiri dari angka satu dan full variance dibawa dalam matriks faktor. Principal component direkomendasikan jika hal yang pokok adalah menentukan bahwa banyaknya faktor harus minimum dengan memperhitungkan varians maksimum dalam data untuk dipergunakan di dalam analysis multivariate lebih lanjut.

2. Common factor analysis

Faktor diestimasi hanya didasarkan pada common variance, communalities dimasukkan dalam matrik korelasi. Metode ini dianggap tepat jika tujuan utamanya mengenali/mengidentifikasi dimensi yang mendasari dan common variance yang menarik perhatian.



PENENTUAN BANYAKNYA FAKTOR


Maksud melakukan analysis faktor adalah mencari variable baru yang disebut faktor yang tidak saling berkorelasi, bebas satu sama lain, lebih sedikit dari variable asli, tapi dapat menyerap sebagian besar informasi yang terkandung dalam variable asli atau yang dapat memberikan sumbangan terhadap varian seluruh variable. Lalu berapa faktor yang perlu disajikan? Ada beberapa cara;

1. Penentuan Apriori

Kadang karena peneliti sebelumnya sudah mengetahui berapa faktor yang digunakan maka kita akan menentukan dulu berapa faktor yang akan digunakan.

2. Penentuan Berdasar Eigenvalue

Faktor dengan eigenvalue lebih besar dari satu yang dipertahankan jika lebih kecil dari satu faktornya tidak diikutsertakan dalam model. Suatu eigenvalue menunjukkan besar sumbangan dari faktor terhadap varian seluruh variable asli. Hanya faktor dengan varian lebih dari 1 yang dimasukkan dalam model. Faktor dengan varian kurang dari 1 tidak baik karena variable asli telah dibakukan yang berarti rata-ratanya 0 dan variansnya 1. Bila banyak variable asli asli kurang dari 20 pendekatan ini menghasilkan sejumlah faktor yang konservatif.

3. Penentuan Berdasar Screeplot

Dapat dilihat dari grafik screeplot dimana scree mulai terjadi menunjukkan banyak faktor yang benar, tepatnya ketika scree mulai mendatar. Kenyataan menunjukkan bahwa penentuan banyaknya faktor dengan screeplot akan mencapai satu atau lebih banyak dari penentuan dengan eigenvalue.

4. Penentuan Didasarkan pada Presentase Varian

Banyak faktor diekstraksi ditentukan sedemikian rupa sehingga kumulatif presentase varian yang diekstraksi oleh faktor mancapai suatu level tertentu yang memuaskan. Ekstraksi faktor dihentikan jika kumulatif presentase varian sudah mencapai paling sedikit 60% atau 75% dari seluruh varian variable asli.

Untuk materi lengkapnya bisa didownload di Materi Lengkap Analisis Faktor

read more


Sunday, January 6, 2013

[Tutorial] Contoh Analisis Regresi Logistik biner/dikotomi dengan SPSS

Sunday, January 6, 2013
1 comments

Pada hari sebelumnya telah dibahas tentang konsep dari regresi logistik biner. Sesuai dengan janji penulis akan dibahas tutorial regresi logistik biner dengan SPSS. (kayak pemilu aja ya.:p). Untuk contoh kasus kali ini, terinspirasi dari tugas kelompok perkuliahan yang diambil dari tugas kakak tingkat. bisa dibilang copas lah ya. tapi, jangan dilihat dari copasnya. tapi lihat dari niatnya dan keinginan untuk saling berbagi semoga dapat membantu mengerjakan tugas, skripsi, tesis atau bahkan disertasi.

tutorial regresi logistik

Contoh Kasus Analisis Regresi Logistik biner:


Dilakukan simulasi untuk melihat pengaruh antara variabel profitabilitas, kompleksitas perusahaan, opini auditor, likuiditas dan ukuran perusahaan terhadap ketepatan penyampaian laporan keuangan tahunan perusahaan. Profitabilitas diukur dengan ROA; variabel kompleksitas terdiri atas 2 kategorik yaitu diberi angka 2 jika mempunyai anak perusahaan dan 1 jika perusahaan tidak mempunyai anak perusahaan; opini auditor diukur dengan 2 jika mendapatkan opini wajar tanpa pengecualian dan 1 untuk opini yang lain; likuiditas diukur dengan Current Ratio; dan ukuran perusahaan diukur dengan logaritma natural market value. Variabel terikatnya adalah ketepatan penyampaian laporan keuangan, dengan kode 1 untuk perusahaan yang tepat waktu dan 0 untuk perusahaan yang terlambat.

Data yang digunakan dalam penelitian ini tidak ditampilkan mungkin kalau teman ingin mencoba juga bisa didownload dibagian bawah nanti ya. dalam tutorial ini menggunakan SPSS 20.Langsung saja ya dengan langkah-langkahnya.

1. Langkah-langkah dalam pengujian data:

1. Pada posisi file telah terbuka, maka akan terlihat pada layar data tentang ketepatan penyampaian laporan keuangan perusahaan dengan sejumlah variabel-variabelnya. Untuk menganalisis, langkah awalnya adalah pilih menu Analyze, kemudian pilih Regression dan Binary Logistic.

regresi logistik spss

2. Akan muncul box dialoge seperti di bawah ini.

logistic regression

Masukan variabel yang berfungsi sebagai variabel tak bebas dari box variabel ke kolom dependent, dan masukan semua varibel bebas pada kotak Covariate. Untuk Method, pilih Enter. Sebenarnya bisa dipilih metode apa saja karena model yang terbentuk akan sama (dalam artian penduga-penduga parameternya akan memiliki nilai-nilai yang sama). Akan tetapi, khusus metode Enter, harus dilakukan proses dua kali. Pertama, data di run dengan semua variabel untuk mengetahui variabel mana yang signifikan, setelah itu di run lagi dengan menggunakan variabel yang signifikan itu. Model yang terbentuk akan sama dengan model yang diperoleh dengan metode lain.

3. Klik Categorical, masukkan semua variabel bebas yang berbentuk kategori pada kotak covariate ke dalam kotak categorical covariates, biarkan contras pada default indicator. Untuk reference kategori pilih bagian kategori yang akan dipakai sebagai referensi atau pembanding yang akan digunakan dalam interpretasi odds ratio. Dapat menggunakan kategori akhir (last) atau kategori pertama (first). Dalam penelitian ini digunakan kategori akhir (last).

reglog dengan spss

4. Kemudian klik Continue. Setelah itu pilih menu option, centang iteration history untuk dapat mengetahui proses iterasi yang telah berlangsung.

Selain itu, akan ditemukan "Classification cut off", yang pada kondisi default sudah diisi dengan 0.5. Nilai ini disebut dengan the cut value atau prior probability, peluang suatu observasi untuk masuk ke salah satu kelompok sebelum karakteristik variabel penjelasnya diketahui. Jika kita tidak mempunyai informasi tambahan tentang data kita, maka kita bisa menggunakan default. Misalnya pada penelitian ini, sebelumnya tidak pernah dilakukan penelitian apakah ukuran perusahaan condong pada satu sisi. dengan alasan ini, dapat digunakan classification cutoff sebesar 0,5. Namun, misalnya pada ada penelitian lain yang telah meneliti maka bisa dinaikkan/diturunkan classification cutoff sesuai hasil penelitian. Dalam penelitian ini semua variabel numerik dalam default 0,5. Abaikan bagain yang lain, klik continue.

langkah-langkah regresi logistik

5. Abaikan bagian yang lain, dan tekan OK maka akan keluar output dari Regresi Logistik.


2. Analisis Data

Setelah keluar output dari hasil running data di SPSS maka diperoleh hasil analisis sebagai berikut :

1. Identifikasi Data yang Hilang


regresi logistik praktek

Pada tabel di atas, dapat dilihat tidak ada data yang hilang (missing cases).


2. Pemberian kode variabel respon oleh SPSS


regresi logistik langkah-langkah

Menurut pengkodean SPSS, yang termasuk kategori sukses adalah penyampaian laporan keuangan tahunan yang tepat.

3. Pemberian kode untuk variabel penjelas yang kategorik

intrepretasi regresi logistik

Pengkodean variabel penjelas hanya dilakukan untuk variabel penjelas yang kategorik karena akan dibentuk dummy variabel. Penelitian ini menggunakan dua variabel penjelas yang kategorik yaitu variabel Opini dan variabel Kompleksitas. Untuk variabel opini, nantinya yang akan digunakan sebagai reference code (kode pembanding) adalah Wajar Tanpa Pengecualian (lihat pada tabel di atas bagian parameter codings yang berkode nol). Sementara untuk variabel Kompleksitas, yang menjadi kode pembanding adalah Punya anak perusahaan. Kode pembanding ini akan digunakan untuk interpretasi Odds Ratio.

4. Uji Signifikansi Model

Dari hasil SPSS dapat digunakan tabel “Omnibus Tests of Model Coefficients” untuk melihat hasil pengujian secara simultan pengaruh variabel bebas ini.

regresi logistik uji simultan

Berdasarkan tabel di atas diperoleh nilai Sig.Model sebesar 0.000. Karena nilai ini lebih kecil dari 5% maka kita menolak Ho pada tingkat signifikansi 5% sehingga disimpulkan bahwa variabel bebas yang digunakan, secara bersama-sama berpengaruh terhadap ketepatan penyampaian laporan keuangan suatu perusahaan. Atau minimal ada satu variabel bebas yang berpengaruh.

5. Persentase Ketepatan Klasifikasi (Percentage Correct)
reglog simultan

Persentase ketepatan model dalam mengkasifikasikan observasi adalah 78.6 persen. Artinya dari 70 observasi, ada 55 observasi yang tepat pengklasifikasiannya oleh model regresi logistik. Jumlah observasi yang tepat pengklasifikasiannya dapat dilihat pada diagonal utama.

6. Uji Parsial dan Pembentukan Model

Pada uji diharapkan Ho akan ditolak sehingga variabel yang sedang diuji masuk ke dalam model. Dengan bantuan tabel “Variables in The Equation” dapat dilihat variabel mana saja yang berpengaruh signifikan sehingga bisa dimasukkan ke model. Jika nilai sig.<a maka Ho ditolak.
cara uji reglog
Berdasarkan hasil di atas diketahui bahwa terdapat 2 variabel bebas yang signifikan berpengaruh terhadap ketepatan penyampaian laporan keuangan perusahaan karena masing-masing variabel tersebut memiliki nilai signifikansi yang lebih kecil dari a=5%. Variabel-variabel tersebut adalah Profitabilitas (Sig.=0.004)dan Likuiditas (Sig.=0.000). Model yang terbentuk adalah :
procedur logistic regression
Dimana :
X_1i = Profitabilitas
X_2i= Likuiditas
i=1,2,…,n

7. Interpretasi Odds Ratio

Nilai Odds ratio ini juga disediakan oleh tabel “Variables in The Equation” pada kolom Exp(B) :
cara uji reglog

Berdasarkan hasil di atas kita dapat menginterpretasikan Odds ratio sebagai berikut :

1. Jika jumlah profitabilitas perusahaan bertambah 1 unit maka kecendrungan perusahaan tersebut untuk tepat waktu menyampaikan laporan keuangan menjadi 2.780 kali lipat.
2. Sebuah perusahaan yang tidak mempunyai anak perusahaan akan memiliki kecenderungan untuk menyampaikan laporan keuangan secara tepat waktu sebesar 3.057 kali dibanding perusahaan yang memiliki anak perusahaan (merujuk pada reference code).
3. Perusahaan dengan opini auditor adalah opini lain cenderung 0.848 kali (lebih rendah) untuk tepat waktu dalam menyampaikan laporan keuangan dibanding dengan perusahaan yang Wajar tanpa Pengecualian.
4. Jika Current ratio pada likuiditas bertambah 1 persen maka perusahaan akan cenderung 1.708 kali untuk tepat waktu menyampaikan laporan keuangannya.
5. Ketika ukuran perusahaan bertambah 1 unit maka perusahaan tersebut cenderung 1.123 kali untuk tepat waktu dalam menyampaikan laporan keuangannya.


Buat yang ingin mencoba silahkan download filenya dibawah ini:
tutorial reglog biner (SPSS 20)


read more


Konsep Regresi Logistik Biner/Dikotomi

0 comments
Analisis regresi logistik merupakan metode analisis yang biasanya digunakan oleh mahasiswa dalam menyelesaikan skripsi berkaitan dengan skripsi tentang persepsi. bahasa gaul metode ini biasa disebut reglog. Untuk pembahasan kali akan dibahas materi reglog dulu. dan akan dilakukan untuk contoh kasusnya dengan software SPSS. Mudah-mudahan bisa membantu para cendikiawan muda termasuk penulis sendiri.hehehhe


 regresi logistik sampul


Analisis regresi logistik digunakan untuk menjelaskan hubungan antara variabel respon yang berupa data dikotomik/biner dengan variabel bebas yang berupa data berskala interval dan atau kategorik (Hosmer dan Lemeshow, 1989). Variabel yang dikotomik/biner adalah variabel yang hanya mempunyai dua kategori saja, yaitu kategori yang menyatakan kejadian sukses (Y=1) dan kategori yang menyatakan kejadian gagal (Y=0). pada model model linear umum komponen acak tidak harus mengikuti sebaran normal, tapi harus masuk dalam sebaran keluarga eksponensial. Sebaran bernoulli termasuk dalam salah satu dari sebaran keluarga eksponensial. Variabel respon Y ini, diasumsikan mengikuti distribusi Bernoulli.

Timbul pertanyaan: Perbedaan antara regresi logistik dengan analisis regresi biasa? kenapa tidak pakai analisis regresi biasa aja?
Sebenarnya untuk masalah diatas bisa digunakan analisis regresi OLS. Tapi harus memenuhi asumsi bahwa 0 <= E(Yi ÷ Xi) <= 1. Namun persyaratan tersebut sulit untuk terpenuhi. sehingga metode regresi OLS kurang cocok untuk data kuantitatif dan lebih baik menggunakan metode regresi logistik.

contoh Kasus dalam regresi logsitik biner:
1. Pengaruh Tingkat Pendidikan, Lapangan Kerja yg dimasuki, Pendapatan, Pengeluaran, Jumlah ART terhadap status kemiskinan (Miskin/TIdak Miskin).
2. Pengaruh Pendapatan Keluarga, Banyaknya Anggota Keluarga, Jenis rumah, Usia Kepala Keluarga terhadap Kepemilikan rumah (Punya rumah/tidak)

Berdasarkan dua contoh tersebut mungjkin sudah membuka pikiran untuk kasus seperti apa regresi logistik digunakan. intinya variabel dependentnya dikotomi artinya memiliki dua kategori seperti pada kasus diatas yang ditebal.

Kenapa cuma dua kategori aja? tidak bisa lebih dari tiga kategori?

Untuk metode ini tidak bisa karena hanya bisa dua sesuai dengan namanya. untuk masalah diatas ada metode lain yang bisa digunakan yaitu regresi logistik ordinal.

Bagaimana langkah-langkah atau prosedur statistiknya? sebagai referensi buat skripsi.hehehe
Bentuk umum model peluang regresi logistik dengan p variabel penjelas, diformulasikan sebagai berikut:
regresi logistik model umum
dengan π(x) adalah peluang kejadian sukses dengan nilai probabilita 0≤π(x)≤1 dan βj adalah nilai parameter dengan j = 1,2,......,p. π(x) merupakan fungsi yang non linier, sehingga perlu dilakukan transformasi ke dalam bentuk logit untuk memperoleh fungsi yang linier agar dapat dilihat hubungan antara variabel bebas dan variabel tidak bebas. Dengan melakukan transformasi dari logit π(x), maka didapat persamaan yang lebih sederhana, yaitu:
regresi logistik logit
Jika dari beberapa variabel bebas ada yang berskala nominal atau ordinal, maka variabel tersebut tidak akan tepat jika dimasukkan dalam model logit karena angka-angka yang digunakan untuk menyatakan tingkatan tersebut hanya sebagai identifikasi dan tidak mempunyai nilai numerik dalam situasi seperti ini diperlukan variabel dummy. Untuk variabel bebas dengan skala ordinal maupun nominal dengan k kategori, akan diperlukan sebanyak k-1 variabel dummy.


Pendugaan Parameter

Metode untuk mengestimasi parameter-parameter yang tidak diketahui dalam model regresi logistik ada 3 yaitu:
1. Metode kemungkinan maksimum (Maximum Likelihood Method)
2. Metode kuadrat terkecil tertimbang noniterasi (Noniterative Weight Least Square Method)
3. Analisis fungsi diskriminan (Discriminant Fuction Analysis)

Pada dasarnya metode maksimum Likelihood merupakan metode kuadrat terkecil tertimbang dengan beberapa proses iterasi, sedangkan metode noniterative weight least square method hanya menggunakan satu kali iterasi. kedua metode ini asymptoticaly equivalent, artinya jika ukuran sampel besar keduanya akan menghasilkan estimator yang identik. Penggunaan fungsi diskriminan mensyaratkan variabel penjelas yang kuantitatif berdistribusi normal. Oleh karena itu, penduga dari fungsi diskriminan akan over estimate bila variabel penjelas tidak berdistribusi normal.

Dari Ketiga metodei di atas, metode yang banyak digunakan adalah metode maksimum likelihood dengan alasan lebih praktis (Nachrowi dan Usman, 2002). Metode maksimu likelihoood ini menduga parameter dengan nilai yang memaksimumkan fungsi likelihood (likelihood function).

Uji Signifikansi Model

Untuk mengetahui pengaruh variabel bebas terhadap variabel tidak bebas secara bersama-sama (overall) di dalam model, dapat menggunakan Uji Likelihood Ratio. Hipotesisnya adalah sebagai berikut:
Ho: β1 = β2 =....= βp = 0 (tidak ada pengaruh veriabel bebas secara simultan terhadap variabel tak bebas)
H1: minimal ada satu βj ≠ 0 (ada pengaruh paling sedikit satu veriabel bebas terhadap variabel tak bebas)
Untuk j = 1,2,...,p
Statistik uji yang digunakan adalah:

regresi logistik stataistik uji
Dengan :
Lo = Maksimum Lieklihood dari model reduksi (Reduced Model) atau model yang terdiri dari konstanta saja
Lp = Maksimum Likelihood dari model penuh (Full Model) atau dengan semua variabel bebas.

Statistik G2 ini mengikuti distribusi Khi-kuadrat dengan derajad bebas p sehingga hipotesis ditolak jika p-value < α, yang berarti variabel bebas X secara bersama-sama mempengaruhi variabel tak bebas Y.


Uji Parsial dan Pembentukan Model


Pada umumnya, tujuan analsis statistik adalah untuk mencari model yang cocok dan keterpautan yang kuat antara model dengan data yang ada. Pengujian keberartian parameter (koefisien β) secara parsial dapat dilakukan melalui Uji Wald dengan hipotesisnya sebagai berikut:

Ho: βj = 0 (variabel bebas ke j tidak mempunyai pengaruh secara signifikan terhadap variabel tidak bebas)
H1: βj ≠ 0 (variabel bebas ke j mempunyai pengaruh secara signifikan terhadap variabel tidak bebas)
Untuk j = 1,2,....,p

Dengan statistik uji sebagai berikut:

 regresi logistik uji parsial

Hipotesis akan ditolak jika p-value < α yang berarti variabel bebas Xj secara partial mempengaruhi variabel tidak bebas Y.

Odds Ratio

Odds ratio merupakan ukuran risiko atau kecenderungan untuk mengalami kejadian ‘sukses ‘ antara satu kategori dengan kategori lainnya, didefinisikan sebagai ratio dari odds untuk xj = 1 terhadap xj = 0. Odds ratio ini menyatakan risiko atau kecenderungan pengaruh observasi dengan xj = 1 adalah berapa kali lipat jika dibandingkan dengan observasi dengan xj = 0. Untuk variabel bebas yang berskala kontinyu maka interpretasi dari koefisien βj pada model regresi logistik adalah setiap kenaikan c unit pada variabel bebas akan menyebabkan risiko terjadinya Y = 1, adalah exp(c.βj) kali lebih besar.

Odds ratio dilambangkan dengan θ, didefinisikan sebagai perbandingan dua nilai odds xj = 1 dan xj = 0, sehingga:


regresi logistik odd rasio

read more


Wednesday, December 26, 2012

[TUTORIAL] Uji T berpasangan 2 kelompok variabel numerik untuk parametrik

Wednesday, December 26, 2012
0 comments

Uji T berpasangan merupakan salah satu uji hipotesis komparatif untuk dua data berkelompok. selain itu, uji ini juga merupakan uji untuk statistik parametrik dengan syarat merupakan variabel numerik dan berdistribusi normal. apabila syarat tersebut tidak terpenuhi maka menggunakan statistik non parametrik. untuk kasus uji T berpasangan menggunakan uji wilcoxon apabila datanya tidak berdistribusi normal yang mana menggunakan statistik non-parametrik.

uji t berpasangan parametrik spss

Untuk lebih jelasnya dengan contoh Kasus sebagai berikut:

Suatu penelitian dilakukan untuk menguji perbedaan stress kerja karyawan yang bekerja di ruangan yang bersifat tradisional lalu pendah pada ruangan yang modern.
Apakah terdapat perbedaan stres karyaman ketika berada di ruangan tradisional dengan ketika berada diruangan modern?


Menjawab pertanyaan pada kasus tersebut, berikut langkah-langkah melakukan uji T berpasangan:

1. Memeriksa syarat uji t untuk kelompok berpasangan:
a. Sebaran data harus normal 
b. varians data tidak perlu diuji karena kelompok data berpasangan
2. Jika memenuhi syarat (sebaran data normal), maka dipilih uji t berpasangan.
3. Jika tidak memenuhi syarat (sebaran data tidak normal) dilakukan terlebih dahulu transformasi data.
4. Jika variabel baru hasil transformasi mempunyai sebaran data yang normal, maka dipakai uji t berpasangan
5. Jika variabel baru hasil transformasi mempunyai sebaran data yang tidak normal, maka dipilih uji wilcoxon.

Setelah kita memperoleh data dan memasukkan ke dalam SPSS, maka hasilnya sebagai berikut:

uji t berpesangan parametrik


Pada tahap pertama memeriksa syarat uji t berpasangan. syaratnya yaitu data harus bersebaran normal sehingga perlu dilakukan uji normalitas. Sesuai dengan langkah-langkah uji normalitas diperoleh hasil  (untuk belum tahu bisa lihat pada postingan sebelumnya [TUTORIAL] Uji normalitas dengan SPSS)

uji t normalitas

Dengan melihat hasil test of normality Shapiro-Wilk, diperoleh hasil nilai P-value untuk kedua kelompok data adalah lebih dari 0,05. Dengan demikian, dapat diambil kesimpulan bahwa distribusi kedua kelompok data adalah normal.

Karena syarat data berdistribusi normal terpenuhi, maka uji hipotesis yang dipergunakan adalah uji t berpasangan.

Langkah-langkah uji t berpasangan:


  • Analyze, kemudian compare means....Paired sample t
  • Masukkan kedua variabel kedalam kotak paired variables. seperti gambar berikut.

uji t berpasangan spss


  • kemudian continue...ok...Hasilnya sebagai berikut


uji t berpasangan spss


Intrepretasi hasil uji t berpasangan:


1. Bagian paired samples statistics menggambarkan deskripsi masing-masing variabel.

2. Bagian paired samples correlation menunjukkan korelasi antara dua variabel. Tampak korelasi kuat(0,921) dan signifikan (sig=0,000). Salah satu syarat uji t berpasangan adalah kedua kelompok data saling berkorelasi tinggi (r>0,9)

3. Tabel ke tiga Paired Sample Test menggambarkan hasil uji t berpasangan. Lihat kolom sig.(2 tailed). diperoleh nilai significancy 0,492(p>0,05), artinya "tidak ada perbedaan rerata stres karyawan yang berada pada ruang tradisional dengan berapa pada ruang modern".



Referensi:

Statistik Untuk Kedokteran dan Kesehatan.
Diklat Khusus SPSS, Universitas Gunadarma. 

Untuk yang ingin mencoba dapat mendownload di contoh kasus uji t berpasangan dengan SPSS

read more


[TUTORIAL] Uji normalitas SPSS

1 comments
Normalitas merupakan suatu distribusi yang menunjukkan sebaran data yang seimbang sebagian besar data berada pada nilai di tengah. Normalitas merupakan syarat keharusan dan pertama pada analisis parametrik dan analisis regresi. Uji normalitas bertujuan untuk menguji apakah dalam model regresi, variabel penggangu atau residual memiliki distribusi normal.  Jika asumsi ini dilanggar, maka uji statistik menjadi tidak valid atau bias terutama untuk sampel kecil. Uji normalitas dapat dilakukan melalui dua pendekatan yaitu  secara deskriptif dan inferensia.


Untuk mendeteksi normalitas dapat digunakan beberapa cara sebagai berikut:

1. Secara Deskriptif
Menghitung koefisien varians
Menghitung rasio skewness
Menghitung rasio kurtosis
Melihat Histogram
Melihat normal Q-Q plot
Melihat Detrended normal Q-Q plot
Melihat Box-plot
2. Menilai sebaran data secara analitik: Uji kolmogorov-Smirnov atau Shapiro-Wilk

Menentukan apakah data berdistribusi normal dengan menggunakan metode diatas tentunya mengadung kriteria-kriteria sehingga dapat dikatakan data tersebut berdistribusi normal atau tidak. Berikut beberapa syarat/kriteria uji normalitas pada metode-metode diatas. untuk lebih jelas kita menggunakan dengan penyelesaian contoh kasus berikut.

Langkah-Langkah uji normalitas:

  1. Dari baris menu pilih Analyze, kemudian pilih Decriptive statistic, Explore
  2. Masukan Variabel tradisional  ke dalam dependent list.
  3. Pilh kotak plots, kemudian pilih Factor levels together pada boxplot(untuk menampilkan boxplot), pilih Histogram pada Descriptive (untuk menampilkan histogram) dan Normality Plots with test (untuk menampilkan plot dan uji normalitas). Akan terlihat tampilan sebagai berikut:
uji normalitas spss


Proses telah slesai, Klik continue...OK...


Mari kita melakukan intrepretasi hasil satu demi satu:

1. Secara Deskriptif


Normalitas dapat dilakukan dengan melihat secara deskriptif dari data tersebut. adapun yang digunakan untuk melihat normalitas adalah koefisien varians, rasio skewness dam rasio kurtosis.
uji normalitas deskriptif

a. Koefisien Varians


koefisien varians ini tidak mutlak kita peroleh dari hasil SPSS sehingga kita harus melakukan perhitungan terlebih dahulu.

Koefisien varians=(standar deviasi/mean) X 100%=7,363/86,93 x 100%=8,47%

Data tersebut normal jika nilai koefisien varians <30%. Setelah dilakukan perhitungan pada output diatas diperoleh koefisien varians sebesar 8,47%. sehingga dapat disimpulkan data tersebut normal.

b. Rasio Skewness


skewness merupakan suatu besaran statistik yang menunjukkan kemiringan data.  skewness ini menunjukkan datanya cenderung berada di tengah atau miring di satu sisi. Statistik ini dapat digunakan untuk melihat sebaran data normal yaitu dengan rasio skewness. rasio skewness diperoleh dari:

rasio skewness = skewness/standar error skewness = -0,052/0,58 = 0,089

Data dikatakan normal ketika nilai rasio skewness berada pada rentang nilai -2 sampai 2. Hasil dari contoh output diperoleh sebesar 0,089 sehingga disimpulkan data tersebut normal.

c. Rasio Kurtosis

kurtosis menunjukkan keruncingan suatu data. kriteria normalitas sama dengan rasio skewness yaitu -2 sampai 2. selain itu, perhitungan juga hampir sama yaitu dengan:

rasio kurtosis = kurtosis / standar error kurtosis = -1.212/1.121 = 1,08

Dapat disimpulkan bahwa data tersebut normal karena nilai rasio kurtosis berada pada interval -2 sampai 2.

d. Melihat Histogram


Pada output diperoleh gambar histogram sebagai berikut:
uji normalitas histogram

dengan melihat histogram, tampak bahwa  sebaran data yang diperoleh tidak begitu mirip normal. walaupun hanya sedikit terbentuk.

e. Melihat Q-Q plot


Secara teoritis, suatu set data dikatakan mempunyai sebaran normal apabila data tersebar di sekitar garis. Dari output, diperoleh Q-Q plot sebagai beikut:
uji normalitas q-q plot

Terlihat bahwa data menyebar di sekitar garis, dan tidak ada data yang letaknya jauh dari garis. kemungkinan besar, sebaran data normal.

f. Melihat Detrended normal Q-Q


Secara teoritis, suatu data dikatakan mempunyai sebaran normal apabila data tersebar di sekitar garis (angka nol). dari outpu diperoleh detrended normal Q-Q plot sebagai berikut:
uji normalitas detrended

Terlihat bahwa data tersebar dekat disekitar dari garis sehingga kemungkinan besar sebaran data normal.

g. Melihat Boxplot


Secara teoritis data dikatakan berdistribusi normal apabila:
1. nilai median ada ditengah-tengah kotak
2. niali whisker terbagi secara merata ke-atas dan ke-bawah
3. tidak ada nilai ekstrim atau outlier

Dari output diperoleh Boxplot sebagai berikut:
 uji normalitas boxplot
Terlihat bahwa median terletak agak ke atas kotak, whisker relatif simetris, dan tidak terdapat data outlier.
Berdasarkan data yang ditampilkan boxplot, kemungkinan besar sebaran data tidak normal.


2. Secara Inferensia (Uji Kolmogorov Smirnov dan Shapiro Wilk)


Untuk mengetahui apakah sebaran data mempunyai sebaran normal atau tidak secara analitik yaitu dengan menggunakan Kolmogrov-Smirnov atau Shapiro Wilk. Uji Kolmogorov-Smirnov dipergunakan untuk sampel besar sedangkan Shapiro Wilk untuk sampel yang sedikit:

Dari output diperoleh hasil sebagai berikut.

uji normalitas kolmogorov smirnov

Oleh karena datanya kecil (n=15) maka menggunakan Shapiro Wilk. berdasarkan nilai Shapiro Wilk diperoleh nilai p=0,346. karena nilai p<0,05 maka dpat disimpulkan bahwa data berdistribusi normal.



Referensi:

Statistik Untuk Kedokteran dan Kesehatan.
Diklat Khusus SPSS, Universitas Gunadarma.

Untuk yang ingin mencoba dapat mendownload di contoh kasus uji normalitas dengan SPSS



read more


 

Powered by Blogger.

Get this widget!