Jan 6, 2013

Konsep Regresi Logistik Biner/Dikotomi

Analisis regresi logistik merupakan metode analisis yang biasanya digunakan oleh mahasiswa dalam menyelesaikan skripsi berkaitan dengan skripsi tentang persepsi. bahasa gaul metode ini biasa disebut reglog. Untuk pembahasan kali akan dibahas materi reglog dulu. dan akan dilakukan untuk contoh kasusnya dengan software SPSS. Mudah-mudahan bisa membantu para cendikiawan muda termasuk penulis sendiri.hehehhe


 regresi logistik sampul
Analisis regresi logistik digunakan untuk menjelaskan hubungan antara variabel respon yang berupa data dikotomik/biner dengan variabel bebas yang berupa data berskala interval dan atau kategorik (Hosmer dan Lemeshow, 1989). Variabel yang dikotomik/biner adalah variabel yang hanya mempunyai dua kategori saja, yaitu kategori yang menyatakan kejadian sukses (Y=1) dan kategori yang menyatakan kejadian gagal (Y=0). pada model model linear umum komponen acak tidak harus mengikuti sebaran normal, tapi harus masuk dalam sebaran keluarga eksponensial. Sebaran bernoulli termasuk dalam salah satu dari sebaran keluarga eksponensial. Variabel respon Y ini, diasumsikan mengikuti distribusi Bernoulli.
Timbul pertanyaan:Perbedaan antara regresi logistik dengan analisis regresi biasa? kenapa tidak pakai analisis regresi biasa aja?
Sebenarnya untuk masalah diatas bisa digunakan analisis regresi OLS. Tapi harus memenuhi asumsi bahwa 0 <= E(Yi ÷ Xi) <= 1. Namun persyaratan tersebut sulit untuk terpenuhi. sehingga metode regresi OLS kurang cocok untuk data kuantitatif dan lebih baik menggunakan metode regresi logistik.

contoh Kasus dalam regresi logsitik biner:


  1. Pengaruh Tingkat Pendidikan, Lapangan Kerja yg dimasuki, Pendapatan, Pengeluaran, Jumlah ART terhadap status kemiskinan (Miskin/TIdak Miskin).
  2. Pengaruh Pendapatan Keluarga, Banyaknya Anggota Keluarga, Jenis rumah, Usia Kepala Keluarga terhadap Kepemilikan rumah (Punya rumah/tidak)

Berdasarkan dua contoh tersebut mungjkin sudah membuka pikiran untuk kasus seperti apa regresi logistik digunakan. intinya variabel dependentnya dikotomi artinya memiliki dua kategori seperti pada kasus diatas yang ditebal.

Kenapa cuma dua kategori aja? tidak bisa lebih dari tiga kategori?

Untuk metode ini tidak bisa karena hanya bisa dua sesuai dengan namanya. untuk masalah diatas ada metode lain yang bisa digunakan yaitu regresi logistik ordinal.

Bagaimana langkah-langkah atau prosedur statistiknya? sebagai referensi buat skripsi.hehehe
Bentuk umum model peluang regresi logistik dengan p variabel penjelas, diformulasikan sebagai berikut:
regresi logistik model umum
dengan π(x) adalah peluang kejadian sukses dengan nilai probabilita 0≤π(x)≤1 dan βj adalah nilai parameter dengan j = 1,2,......,p. π(x) merupakan fungsi yang non linier, sehingga perlu dilakukan transformasi ke dalam bentuk logit untuk memperoleh fungsi yang linier agar dapat dilihat hubungan antara variabel bebas dan variabel tidak bebas. Dengan melakukan transformasi dari logit π(x), maka didapat persamaan yang lebih sederhana, yaitu:
regresi logistik logit
Jika dari beberapa variabel bebas ada yang berskala nominal atau ordinal, maka variabel tersebut tidak akan tepat jika dimasukkan dalam model logit karena angka-angka yang digunakan untuk menyatakan tingkatan tersebut hanya sebagai identifikasi dan tidak mempunyai nilai numerik dalam situasi seperti ini diperlukan variabel dummy. Untuk variabel bebas dengan skala ordinal maupun nominal dengan k kategori, akan diperlukan sebanyak k-1 variabel dummy.

Asumsi-asumsi dalam regresi logistik:

  • Tidak mengasumsikan hubungan linier antar variabel dependen dan independent
  • Variabel dependen harus bersifat dikotomi (2 variabel)
  • Variabel independent tidak harus memiliki keragaman yang sama antar kelompok variabel
  • Kategori dalam variabel independent harus terpisah satu sama lain atau bersifat eksklusif
  • Sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan hingga 50 sampel data untuk sebuah variabel prediktor (bebas).

Pendugaan Parameter

Metode untuk mengestimasi parameter-parameter yang tidak diketahui dalam model regresi logistik ada 3 yaitu:
1. Metode kemungkinan maksimum (Maximum Likelihood Method)
2. Metode kuadrat terkecil tertimbang noniterasi (Noniterative Weight Least Square Method)
3. Analisis fungsi diskriminan (Discriminant Fuction Analysis)

Pada dasarnya metode maksimum Likelihood merupakan metode kuadrat terkecil tertimbang dengan beberapa proses iterasi, sedangkan metode noniterative weight least square method hanya menggunakan satu kali iterasi. kedua metode ini asymptoticaly equivalent, artinya jika ukuran sampel besar keduanya akan menghasilkan estimator yang identik. Penggunaan fungsi diskriminan mensyaratkan variabel penjelas yang kuantitatif berdistribusi normal. Oleh karena itu, penduga dari fungsi diskriminan akan over estimate bila variabel penjelas tidak berdistribusi normal.

Dari Ketiga metodei di atas, metode yang banyak digunakan adalah metode maksimum likelihood dengan alasan lebih praktis (Nachrowi dan Usman, 2002). Metode maksimu likelihoood ini menduga parameter dengan nilai yang memaksimumkan fungsi likelihood (likelihood function).

Uji Signifikansi Model

Untuk mengetahui pengaruh variabel bebas terhadap variabel tidak bebas secara bersama-sama (overall) di dalam model, dapat menggunakan Uji Likelihood Ratio. Hipotesisnya adalah sebagai berikut:
Ho: β1 = β2 =....= βp = 0 (tidak ada pengaruh veriabel bebas secara simultan terhadap variabel tak bebas)
H1: minimal ada satu βj ≠ 0 (ada pengaruh paling sedikit satu veriabel bebas terhadap variabel tak bebas)
Untuk j = 1,2,...,p
Statistik uji yang digunakan adalah:

regresi logistik stataistik uji
Dengan :
Lo = Maksimum Lieklihood dari model reduksi (Reduced Model) atau model yang terdiri dari konstanta saja
Lp = Maksimum Likelihood dari model penuh (Full Model) atau dengan semua variabel bebas.

Statistik G2 ini mengikuti distribusi Khi-kuadrat dengan derajad bebas p sehingga hipotesis ditolak jika p-value < α, yang berarti variabel bebas X secara bersama-sama mempengaruhi variabel tak bebas Y.

Uji Parsial dan Pembentukan Model

Pada umumnya, tujuan analsis statistik adalah untuk mencari model yang cocok dan keterpautan yang kuat antara model dengan data yang ada. Pengujian keberartian parameter (koefisien β) secara parsial dapat dilakukan melalui Uji Wald dengan hipotesisnya sebagai berikut:

Ho: βj = 0 (variabel bebas ke j tidak mempunyai pengaruh secara signifikan terhadap variabel tidak bebas)
H1: βj ≠ 0 (variabel bebas ke j mempunyai pengaruh secara signifikan terhadap variabel tidak bebas)
Untuk j = 1,2,....,p

Dengan statistik uji sebagai berikut:

 regresi logistik uji parsial

Hipotesis akan ditolak jika p-value < α yang berarti variabel bebas Xj secara partial mempengaruhi variabel tidak bebas Y.

Odds Ratio

Odds ratio merupakan ukuran risiko atau kecenderungan untuk mengalami kejadian ‘sukses ‘ antara satu kategori dengan kategori lainnya, didefinisikan sebagai ratio dari odds untuk xj = 1 terhadap xj = 0. Odds ratio ini menyatakan risiko atau kecenderungan pengaruh observasi dengan xj = 1 adalah berapa kali lipat jika dibandingkan dengan observasi dengan xj = 0. Untuk variabel bebas yang berskala kontinyu maka interpretasi dari koefisien βj pada model regresi logistik adalah setiap kenaikan c unit pada variabel bebas akan menyebabkan risiko terjadinya Y = 1, adalah exp(c.βj) kali lebih besar.

Odds ratio dilambangkan dengan θ, didefinisikan sebagai perbandingan dua nilai odds xj = 1 dan xj = 0, sehingga:


regresi logistik odd rasio
Silahkan klik link berikut Tutorial regresi logistik dengan SPSS
Written by: Nasrul Setiawan
STATISTIK CERIA, Updated at: 6:38 AM

18 comments :

  1. disini yang ingin saya tanyakan adalah mengenai penggunaan datanya . apakah regresi logistik bisa digunakan untuk mengolah data individu dengan struktur data panel ? mohon bantuannya dalam memahami metode ini dan juga beserta referensinya berasal dari bukunya siapa ? teima kasih

    ReplyDelete
    Replies
    1. analisis regresi logistik sama regresi data panel yang saya tahu itu berbeda. Kalau regresi logistik untuk data panel itu saya belum pernah menemukan. Kecuali, kalau anda memperlakukan data panel itu sebagai data crossectional biasa. Memang datanya seperti apa?
      Untuk referensi Regrsei logistik mungkin bisa baca bukunya Alan Agresti, Analisis Data Kategorik, kayaknya ada di mbah google.

      Delete
  2. Saya tidak mengerti mengenai ialah bagaimana cara membuat peubah dummy bagi peubah bebas yang berskala nominal dan ordinal ?

    ReplyDelete
    Replies
    1. kalau datanya berskala nominal atau ordinal variabelnya kan tidak berbentuk angka tp berupa kategori dan tidak bisa diregresikan langsung. Disinilah gunanya variabel dummy, kalau kategorinya ada sebanyak n, maka dummy ada sebanyak n-1. Misal, datanya adalah pendidikan terakhir: sd, smp, sma, dan peruguruan tinggi. Dummy nya ada d1, d2, d3. Secara berurutan, nilai dummy kalau kategorinya sd= 0,0,0; smp=1,0,0; sma=0,1,0; perguruan tinggi=0,0,1

      Delete
  3. Saya ingin bertanya bagaimana jika variabel independennya merupakan variabel campuran (nominal dan rasio) namun variabel dependennya adalah rasio (metric). Apkah masih bisa menggunakan uji regresi logistic??
    Terimaksih untuk jawabannya :)

    ReplyDelete
    Replies
    1. Masih bisa pak, dan inilah memang salah satu kemudahan yang ada di ReLog.

      Delete
  4. Bagaimana dgn penelitian yang variabel independennya merupakan campuran antara metric dan non metric namun variabel dependennya merupakan adalah metric (rasio)? apakah pengujian.a tetap menggunakan regresi logistik?
    Terima kasih untuk jawabannya :)

    ReplyDelete
    Replies
    1. kayaknya itu cukup pake regresi linear biasa dengan dummy variabel.. karena Y data kontinyu

      Delete
  5. Siang mas.. Saya Echa.. ingin menanyakan..pada penelitian saya (data non parametrik, var dependen dan independen keduanya rasio) didapat hasil korelasi spearman yg bermakna.. saya ingin melanjutkan regresinya..tp setelah saya uji regresi liniernya trnyt residualnya uji Kolmogorov tidak terdistribusi normal juga..hehhe.. Sebaiknya saya menggunakan regresi apa ya mas? apakah hrs menggunakan regresi logistik (pdhal data saya rasio)..mhn pencerahannya ya mas..tksh bnyk

    ReplyDelete
    Replies
    1. Siang...
      kalau datanya rasio mungkin lebih baik menggunakan korelasi pearson...
      kalau datanya tidak normal bisa dicoba transformasi dulu variabelnya mas...

      Delete
  6. assalamuaialikum mas,mengenai analisis regresi logistik apa bisa menggunakan uji asumsi klasik? jika iya alasannya dan jika tidak bisa alsannya apa mas?? mohon petunjuk..

    ReplyDelete
    Replies
    1. wa alaikumsalam...
      metode regresi logistik tidak perlu menguji asumsi klasik karena estimasi koefisien2 di dalam persamaan reglog tidak menggunakan OLS...
      Uji asumsi klasik ditujukan pada metode analisis yang menggunakan metode estimasi OLS, seperti regresi linier dkk...

      Delete
  7. Assalamu'alaikum.
    Ka, mau tanya.
    Di logit, kalo salah satu variabel prediktor yang bentuknya logaritma natural (ln), misanya variabel pengeluaran dalam bentuk ln, itu gimana interpretasi odds ratio nya?
    apa sama aja kaya di analisis regresi linier?
    misal odds ratio nya 3, berarti tiap kenaikan satu persen pengeluaran, kecenderungan "sukses" akan meningkat sebesar 3 kali. apa seperti itu?
    terimakasih. jazakumullaahu khairan.

    ReplyDelete
    Replies
    1. Wa'alaikumsalam,
      knapa di-ln-kn dek? mending variabelnya yang mentah saja, tidak usah ditransformasi, supaya reglognya tidak mubazir...
      sama2 dek.

      Delete
    2. --melanjutkan pertanyaan--

      di-ln-kn, tujuannya biar mempermudah interpretasi ka, tapi ternyata malah bingung cara nginterprestinya. kalo gak di-ln-kn, ketika odds nya 2, berarti intrpretasinya: setiap pertambahan "satu" rupiah pengeluaran, meningkatkan kecenderungan "sukses" sebesar 2x, apakah seperti itu?

      maksud dari "reglognya mubadzir" itu gmn?

      Delete
    3. makanya tidak usah di-ln-kan dek, selain jd makin susah interpretasi, biasanya transformasi dilakukan untuk menormalkan data, sementara metode reglog tidak butuh asumsi normalitas.
      Reglog itu metode yang persyaratannya paling ringan di antara metode regresi lain, jadi kalau datanya diperlakukan seperti ketika memakai regresi biasa (yg syaratnya banyak) itu menurut saya mubazir.

      Delete
  8. This comment has been removed by the author.

    ReplyDelete
  9. Assalamu'alaykum Mas Chalik Mawardi.
    Mohon izin saya ikut nanya juga ya, sedang menyusun skripsi. Ada beberapa pertanyaan:
    1. Apakah Data berskala Ordinal bisa hanya terdiri dari dua kategori? Contohnya para pelamar PNS dikategorikan menjadi "lulus tes" dan "tidak lulus tes".
    2. Variabel penelitian saya hanya terdiri dari satu variabel dependen dan satu variabel independen. Variabel dependennya sebenarnya terdiri dari 4 kategori, tetapi bisa juga diolah menjadi dikotomi. Sedangkan untuk variabel independennya interval, tetapi juga bisa diolah menjadi dhikotom. Mohon saran Mas Chalik sebaiknya saya menggunakan metode statistik apa?
    Terima kasih sebelumnya.

    ReplyDelete

 

Copyright @ 2013 Statistik Ceria