Apr 12, 2014

uji chi squared

Setelah sebelumnya sudah membahas tentang materi umum non parametrik. kali ini akan menjelaskan salah satu dari uji non parametrik. Postingan kali ini membahas mengenai uji chi-square. Sedikit berbeda dengan sebelumnya, Saya  mencoba memulai dengan contoh agar lebih mudah dipahami. Mudah-mudahan lebih ngerti ya, kalau belum ngerti di komen yaaa.

Contoh uji chi square : Sebuah dadu setimbang dilempar sekali 120 kali,di peroleh data sebagai berikut.sisi 1 = 20, sisi 2 = 22, sisi 3 = 17, sisi 4 = 18, sisi 5 = 19 dan sisi 6 = 24. Dari hasil tersebut kita ingin lihat apakah hasi lemparan tersebut masuk akal. maksud dari masuk akal peluang muncul ke enam sisi tersebut sama 120/6 = 20. jadi, kita pengen tahu apakah lemparan itu masuk akal.

Contoh di atas merupakan salah satu contoh penggunaan uji chi-square. pertanyaannya pasti kenapa? disini kita melakukan observasi (melempar dadu) sebanyak 120 kali. terus kita ingin membuktikan secara ilmiah apakah hasil observasi sesuai dengan perkiraan (Harapan) yaitu peluang muncul ke enam sisi sama.
Intinya membandingkan hasil obesravasi dengan harapan yang seharusnya.

Kesimpulannya Uji chi-square merupakan pengujian hipotesis tentang perbandingan antara frekuensi sampel yang benar-benar terjadi (selanjutnya disebut dengan frekuensi observasi – O) dengan frekuensi harapan yang didasarkan pada hipotesis tertentu pada setiap kasus atau data (selanjutnya disebut dengan frekuensi harapan – E).
Setelah kita mengetahui bagaimana uji chi square, sekarang kita perlu mengetahui distribusi dari uji chi square. distribusi chi square ini lah yang digunakan dalam uji ini. sehingga yang menentukan apakah ada perbedaaan atau tidak ya distribu chi squared. Distribusi khi-kuadrat yang kita gunakan sebagai uji statistik mempunyai karakteristik sebagai berikut:

  1. Nilai Khi-kuadrat tidak pernah negatif, karena selisih dari frekuensi pengamatan dan frekuensi harapan dikuadratkan.
  2. Ketajaman dari distribusi khi-kuadrat tidak tergantung pada ukuran sampel tetapi tergantung pada banyaknya kategori yang digunakan.
  3. Distribusi khi-kuadrat bersifat menceng kanan (nilai positif), semakin meningkat jumlah derajat bebas maka semakin mendekati distribusi normal.

distribusi chi squared


Sebagai rumus dasar dari uji Chi Square adalah sebagai berikut:

Sedangkan untuk mendapatkan frekuensi yang diharapkan ada dua cara. pertama frekuensi harapan sudah diketahui seperti contoh di atas kemudian cara kedua dengan menggunakan rumus tapi ini berlaku untuk data yang sudah ditabulasi. nanti akan diberikan contoh. rumusnya seperti berikut.
rumus frekuensi harapan

Langkah-langkah/ prosedur dalam uji chi squared secara umum 


  1. Letakkan frekuensi-frekuensi terobservasi dalam k kategori. Jumlah frekuensi itu seluruhnya harus N, yakni banyak observasi-observasi independen.
  2. Dari H0 tentukan frekuensi yang diharapkan untuk tiap-tiap k sel itu. Manakala k>2, dan bila lebih dari 20% dari Ei kurang dari 5, gabungkanlah kategori-kategori yang berdekatan apabila hal ini memungkinkan, dan dengan demikian kita mengurangi harga k serta meningkatkan nilai beberapa Ei. Apabila k=2, tes X2 untuk kasus satu sampel dapat digunakan secara memadai hanya jika tiap-tiap frekuensi yang diharapkan adalah lima atau lebih.
  3. Hitung nilai X2 dengan rumus Σ(Oi-Ei)2/Ei.
  4. Tetapkan harga db=k-1.
  5. Dengan melihat tabel Chi squared, tetapkan probabilitas yang dikaitkan dengan terjadinya suatu harga yang sebesar nilai X2 hitungan untuk harga db yang bersangkutan. Jika nilai ini sama atau kurang dari α, H0 ditolak.

Uji Chi Square dapat digunakan untuk menguji :


  1. Uji X2 untuk Bentuk Distribusi (Goodness of Fit)
    UJI KECOCOKAN (goodness of fit), membandingkan antara Frekuensi Observasi dengan Frekuensi Teoretis /Harapan. Apakah Frekuensi hasil Observasi menyimpang dari Frekuensi Harapan. Jika nilai (chi square) kecil, berarti kedua frekuensi tersebut sangat dekat, mengarah pada penerimaan kepada hipotesa nol ( Ho).
  2. Uji X2 untuk Independensi
    UJI INDEPENDENSI : Menguji apakah ada atau tidak ada hubungan antara dua kategori suatu hasil observasi dari suatu populasu dnegan kategori populasi lainnya. Uji independensi disebut juga analisis tabel kontingensi
  3. Uji X2 untuk Perbedaan
    Uji chi squared untuk perbedaan: Bentuk hipotesis (Ho) yang digunakan dalam hal ini adalah: “tidak terdapat perbedaan dari keadaan atau peristiwa dari kelompok sampel yang satu dengan kelompok sampel yang lain”. Sedangkan untuk Ha adalah: “terdapat perbedaan dari keadaan atau peristiwa dari kelompok sampel yang satu dengan kelompok sampel yang lain”.

Selanjutnya akan dibahas secara terperinci dari ketiga jenis uji chi squared di atas. Sampai ketemu di pertemuan selanjutnya. Kalau ada yang butuh tabel chi squared silahkan kesini.
Written by: Nasrul Setiawan
STATISTIK CERIA, Updated at: 2:29 AM

Mar 23, 2014

Uji statistik non parametrik

Pada pelajaran terdahulu kita telah mempelajari uji statistik parametrik. Uji statistik parametrik dilakukan terhadap data yang telah berdistribusi normal. Kemudian bagaimana kalau tidak normal? transformasi data pun tidak mengubah keadaan tersebut.atau kah data yg digunakan ternyata bukan data interval dan rasio yang merupakan syarat dari uji parametrik.

Apabila kita menghadapi masalah seperti di atas, jangan putus asa dulu karena masih banyak jalan ke roma.hehehhe.. caranya bisa menggunakan uji non parametrik yang memiliki persyaratan lebih longgar. Salah satun yaitu tidak perlu asumsi normal. Oleh karena itu, uji ini sering disebut uji bebas distribusi. Kali ini akan dibahas secara umum tentang uji non parametrik dan kemudian akan dibahas masing-masing uji tersebut beserta tutorialnya. ini menjadi salah satu proyek statistik ceria.hehehe

Kelebihan uji nonparametrik antara lain:

  • Tidak perlu mengetahui nilai dari populasi. karena dalam uji parametrik memerlukan nilai parametrik untuk menentukan uji parametrik yang digunakan.
  • Dapat menggunakan semua jenis skala data. dalam uji parametrik cuma bisa menggunakan skala interval atau raasio. sedangkan uji parametrik selain bisa menggunakan interval rasio atau interval bisa juga menggunakan skala nominal dan ordinal.
  • Dapat digunakan sampel yang kecil
  • Sederhana dalam perhitungannya

Kelemahan Uji non parametrik:

  • Jika data telah memenuhi semua syarat dalam uji parametrik, maka merupakan pennghamburan data jika uji nonparametrik tetap dilakukan
  • Belum ada metode nonparametrik untuk menguji interaksi-interaksi dalam model analisis varian (anova)
  • Memerlukan tabel statistik khusus dalam menyimpulkan hasil analisis . tabel tersebut tidak mudah diporelah

Jenis-jenis uji nonparametrik  yang bisa digunakan:

Kali ini hanya mencatumkan uji-uji yang digunakan dalam non parametrik. untuk selanjutnya akan dibahas masing-masing uji tersebut. Uji ini saya buat dalam satu tabel sehingga agar mudah dipahami. Berikut summary table uji non parametrik.
nonparametrik



Written by: Nasrul Setiawan
STATISTIK CERIA, Updated at: 8:49 AM

Mar 16, 2014

[Tutorial SPSS] Membuat tabel t, tabel F. dan Chi-square

Analisis statistik inferensia pasti melibatkan uji hipotesis yang mengharuskan anda memiliki data nilai, tabel t, F, dan Ci-square. Anda tidak perlu bingung apabila tabel tersebut tersedia karena SPSS memampukan anda membuat tabel tersebut.

Membuat tabel t

Anda dapat membuat tabel t dengan mudah. Langkah pertama adalah dengan membangun data untuk variabel df (degree of freedom). Sebagai contoh, Anda membangun tabel t dengan nilai df pada rentang 1  sampai 15, seperti pada gambar berikut:
data tabel

Nilai tabel t ditentukan oleh besarnya tingkat keyakinan atau besarnya nilai alfa. Pada contoh ini kita ambil tingkat keyakinan 95% atau nilai alfa=5%. berikut ini langkah-langkah untuk pembuatan tabel t.


  • Klik Transform => compute Variable pada menu sehingga akan muncul kotak dialog Compute Variable
    table t spss
  • Pada kotak target variabel, isikan nama variabel yang akan anda buat, tabel_t(jangan memakai spasi karena menyebabkan tidak valid)
  • Pada function group, pilih inverse DF dan pada Function and Special Variables, piih Idf.T
  • klik dua kali Idf.T pada Function and Special Variables sehingga akan muncul IDF.T(?,?) pada kotak Numeric Expression
  • Tanda tanya pertama, masukkan nilai prob atau tingkat keyakinan. masukkan nilai 0.95. Sedangkan tanda tanya kedua adalah nilai degree of freedom, sisipkan variable df. seperti pada gambar di atas.
  • klik OK.

hasil tabel t

Membuat tabel F

Membuat tabel F pada prinsipnya sama dengan membuat tabel t, namun memiliki dua degree of freedom, yaitu numerator (df1) dan denominator (df2). Contoh kali ini, df1 = 2 dan df2 seperti contoh sebelumnya. Tingkat keyakinan 95% atau nilai alfa = 5%. Berikut ini langkah-langkah untuk embuat tabel F.


  • Klik transform => compute pada menu sehingga akan muncul kotak dialog compute variable.
  • isi kotak target variable dengan nama variable yang akan dibuat => tabel_F
    spss tabel f
  • Pada kotak Numeric Expression ketik IDF.F(?,?,?). masukkan nilai prob atau tingkat keyakinan 0.95 pada tanda tanya pertama. Pada tanda tanya kedua, masukkan nilai df1 dengan 2. Sedangkan tanda tanya ketiga, masukkan nilai df2 atau sisipkan variable df.
  • klik OK.
    hasil tabel f

Membuat Tabel Chi-square

Untuk membuat tabel ci-square pada prinsipnya sama dengan membuat kedua tabe sebelumnya. Berikut  ini langkah-langkahnya:
  • Klik transform => compute pada menu sehingga akan muncul kotak dialog compute variable.
    tabel chi square spss
  • Pada kotak target Variable, isi nama variabel yang akan anda buat => tabel_chisqr. Pada kotak numeric Expression, ketik IDF.CHISQ (?,?). Masukkan nilai prob dengan tingkat kepercayaan 0.95 pada tanda tanya pertama. Sedangkan pada tanda tanya kedua, siapkan variabel df.
  • klik OK.
    hasil tabel chi square
Written by: Nasrul Setiawan
STATISTIK CERIA, Updated at: 12:05 AM

Feb 19, 2014

Permasalahan dengan Data tidak normal: Penyebab dan strategi permasalahan

Data terdistribusi secara normal adalah konsep umum yang sering salah paham oleh beberapa orang. Beberapa orang percaya bahwa semua data yang dikumpulkan dan digunakan untuk analisis harus didistribusikan secara normal. Tapi distribusi normal tidak terjadi sesering orang pikirkan , dan itu bukan tujuan utama . Distribusi normal adalah sarana untuk mencapai tujuan , bukan tujuan itu sendiri .

Data terdistribusi secara normal diperlukan untuk menggunakan sejumlah alat statistik , seperti analisis regresi, analisis Cp / Cpk , uji-t, analisis varians ( ANOVA ) dan masih banyak lagi. Jika seorang praktisi tidak menggunakan alat khusus seperti itu, bagaimanapun , tidak penting apakah data terdistribusi secara normal . Distribusi menjadi masalah hanya ketika praktisi mencapai suatu titik dalam sebuah proyek di mana mereka ingin menggunakan alat statistik yang memerlukan data terdistribusi normal dan mereka tidak memilikinya .
data tidak normal

Probabilitas plot pada Gambar di atas adalah contoh dari uji normalitas. Dalam hal ini , asumsi normalitas jelas tidak dapat terpenuhi, nilai p kurang dari 0,05 dan lebih dari 5 persen dari titik data berada di luar interval kepercayaan 95 persen .

Apa yang bisa dilakukan? Pada dasarnya, ada dua pilihan :

  1. Mengidentifikasi dan, jika mungkin, menentukan alasan data tidak normal dan mengatasinya atau
  2. Gunakan alat yang tidak memerlukan asumsi normalitas

Mengidentifikasi alasan data tidak normal

Ketika data tidak terdistribusi normal , penyebab non - normalitas harus ditentukan dan tindakan perbaikan yang tepat harus diambil . Ada enam alasan yang sering dialami untuk data tidak normal .

Alasan 1 : Data Ekstrim

Terlalu banyak nilai-nilai ekstrim dalam satu set data yang akan menghasilkan distribusi skewness(miring). Normalitas data dapat dicapai dengan menghilangkan data tersebut. Hal ini kemungkinan terjadi karena kesalahan menentukan pengukuran, kesalahan data-entry dan outlier dan untuk mengatasinya dengan menghapus data tersebut dari data yang digunakan untuk alasan yang masuk akal.

sangatlah penting bahwa outlier diidentifikasi sebagai penyebab yang benar-benar membuat data tidak normal sebelum mereka dieliminasi . Jangan lupa : Sifat data terdistribusi normal adalah bahwa kecil persentase dari nilai-nilai ekstrim yang diharapkan, tidak setiap outlier disebabkan oleh alasan khusus.

Alasan 2 : Tumpang tindih dari Dua atau Lebih Proses

Data tidak dapat terdistribusi secara normal karena sebenarnya berasal dari lebih dari satu proses , penjumlahan atau pergeseran, atau dari sebuah proses yang sering bergeser . Jika dua atau lebih set data yang terdistribusi secara normal yang tumpang tindih, data mungkin terlihat bimodal atau multimodal - itu akan memiliki dua atau lebih nilai yang paling sering terjadi.

Tindakan perbaikan untuk situasi ini adalah untuk menentukan X penyebab bimodal atau distribusi multimodal dan kemudian stratifikasi data . Data harus diperiksa lagi untuk normalitas dan setelah proses stratified dapat bekerja secara terpisah .

Gambar berikut menunjukkan data waktu akses website yang memiliki  data tidak normal pada sebuah website.
Website Load Time Data


Setelah stratifikasi waktu akses website antara akhir pekan dibandingkan Data hari kerja, menunjukkan kedua kelompok berdistribusi normal. sehingga bisa dijadikan perimbangan dalam analisis data yang akan.
hasil stratifikasi

Alasan 3 : Kurangnya data Diskriminasi

Round- off error atau perangkat pengukuran dengan resolusi rendah dapat membuat benar-benar data continues dan data terdistribusi normal terlihat diskrit dan tidak normal . Kurangnya data diskriminasi dan karena terbatasnya jumlah nilai yang berbeda - dapat diatasi dengan menggunakan sistem pengukuran yang lebih akurat atau dengan mengumpulkan lebih banyak data.

Alasan 4 : Data yang diurutkan

Data yang dikumpulkan tidak mungkin terdistribusi normal jika itu merupakan hanya bagian dari seluruh data dalam suatu proses. Hal ini dapat terjadi jika data dikumpulkan dan dianalisis setelah penyortiran. Data pada Gambar dibawah diperoleh dari proses produksi botol di mana target adalah untuk menghasilkan botol dengan volume 100 ml . Spesifikasi minimal dan maksimal yang dapat diterima adalah 97,5 ml dan 102,5 ml dan di luar spesifikasi tersebut dihapus dari proses analisis. Sehingga terlihat pada gambar dibawah ini. Dari data tersebut tentunya data tidak terdistribusi normal karena hanya sebagian yang dimasukkan yaitu yang masuk dalam spesifikasi.
sorted data

Alasan 5 : Nilai Mendekati Nol

Jika proses memiliki banyak nilai mendekati nol, distribusi data akan miring (skewness) ke kanan atau kiri. Dalam hal ini, transformasi seperti tenaga transformasi Box - Cox, dapat membantu membuat data normal. Dalam metode ini , semua data dinaikkan , atau diubah , dengan eksponen tertentu , ditunjukkan dengan nilai Lambda . Ketika melakukan transformasi, semua data harus dilakukan perlakuan (diubah) yang sama.

Gambar di bawah ini menggambarkan contoh dari konsep ini. Gambar menunjukkan satu set data siklus - waktu;
limited zero

menunjukkan data yang sama diubah setelah dilakukan transformasi dengan logaritma natural.
transformation box cox
Untuk bahasan transformasi box cox silahkan ke link "transormasi box cox"

Perhatikan : Metode transformasi tidak memberikan jaminan distribusi normal . Selalu periksa dengan uji normalitas untuk menentukan apakah distribusi normal dapat diterpenuhi setelah transformasi .

Alasan 6 Data Mengikuti Distribusi Berbeda

Ada banyak tipe data yang mengikuti distribusi non-normal. Contoh berikut:
  • Distribusi Weibull , ditemukan dengan data survival seperti waktu kelangsungan hidup suatu produk
  • Distribusi log - normal, ditemukan dengan panjang data seperti ketinggian
  • Distribusi Largest-extreme-value, ditemukan dengan data seperti waktu terpanjang down setiap hari
  • Distribusi eksponensial, ditemukan dengan data pertumbuhan seperti pertumbuhan bakteri
  • Distribusi Poisson, ditemukan dengan peristiwa langka seperti jumlah kecelakaan
  • Distribusi binomial, ditemukan dengan " proporsi " data seperti persen barang cacat
Jika data berikut salah satu distribusi yang berbeda , harus ditangani dengan menggunakan alat dengan menggunakan disribusi yang sama.

Alat analisis yang tidak mensyaratkan data normal

Beberapa alat statistik tidak memerlukan data terdistribusi normal . Untuk membantu para praktisi memahami kapan dan bagaimana alat ini dapat digunakan , tabel di bawah ini menunjukkan perbandingan alat yang tidak memerlukan distribusi normal dengan setara - distribusi normal.

Perbandingan alat analisis untuk data berdistribusi normal dan tidak normal
Alat analisis yang menggunakan data normalAlat analisis untuk data tidak normalDistribusi yang diperlukan
T-testMann-Whitney test; Mood’s median test; Kruskal-Wallis testAny
ANOVAMood’s median test; Kruskal-Wallis testAny
uji t berpasanganOne-sample sign testAny
F-test; Bartlett’s testLevene’s testAny
Analisis regresianalisis regresi non parametrikAny
Cp/Cpk analysisCp/Cpk analysisWeibull; log-normal; largest extreme value; Poisson; exponential; binomial

Written by: Nasrul Setiawan
STATISTIK CERIA, Updated at: 6:18 PM

Feb 11, 2014

[Tutorial Eviews] Error Correction Mechanism (ECM)

Pada postingan sebelumnya suda dijelaskan beberapa hal mengenai Error Correction Mechanism (ECM). Nah, pada post ini akan dipaparkan praktek eviews, tahap-tahap ECM yang sudah dijelaskan sebelumnya di Teori ECM. Untuk tutorial, silahkan download datanya di sini.
Lebih jelas mengenai praktek tahap-tahap ECM tersebut dalam eviews adalah sebagai berikut:

I. Pengecekan Stasioneritas

Hal penting yang harus diingat ketika menganalisis data time series adalah mengutamakan pengecekan stasioneritas datanya sebelum diproses lebih lanjut (lebih detail mengenai uji stasioneritas menggunakan eviews bisa dilihat di postingan ini).
Khusus untuk metode ECM, pastikan seluruh variabel yang digunakan, tidak ada yang stasioner pada Level. Oleh karena itu, tahap pertama dalam tutorial ini adalah menguji stasioneritas seluruh variabel. Supaya lebih memudahkan, stasioneritasnya tidak usah dicek satu-satu tapi secara bersamaan. Caranya, pada Workfile ECM, block semua variabel yg ingin digunakan, klik kanan lalu pilih Open > as Group. Setelah itu akan muncul tampilan seperti gambar di bawah:
data lengkap

Selanjutnya, pada window baru, klik View > Unit Root Test, dan kemudian akan muncul window dengan nama "Group Unit Root Test" seperti gambar di bawah. Untuk tahap awal, set tipe data ke Level.
ecm option

Untuk uji stasioneritas kumpulan variabel ini, yang berbeda dengan 1 variabel adalah Test Type-nya (kotak hijau). Supaya stasioneritas masing-masing variabel bisa dicek, pilih Test Type yang ada kata "Individual..."-nya. Setelah itu klik OK, yang lain tidak usah diubah.
Berikutnya akan muncul window yang berisi output seperti:
philips perron


Bagian yang perlu diperhatikan adalah kolom Probability yang posisinya paling bawah output. Karena hasil pengujian yang diinginkan adalah seluruh variabel tidak stasioner pada Level, nilai probabilitas masing-masing variabel harus lebih besar dari alpha yang ditetapkan.
Misalnya kita pakai alpha=0.05, karena semua nilainya memang lebih besar dari 0.05, semua variabel tidak ada yg stasioner pada Level dan penerapan metode ECM, boleh dilanjutkan.
Agar lain kali bisa langsung dilihat, jangan lupa outputnya disimpan. Caranya, klik Freeze, setelah itu akan muncul window baru yang tampilannya sama. Di window baru, klik Name, terserah teman2 outputnya mau dinamai apa. Output yang disimpan tadi akan muncul sebagai objek baru dengan simbol simbol tabel
Untuk output2 berikutnya, kalau mau disimpan, silahkan pakai cara tersebut.

Kalau sudah dipastikan tidak ada yang stasioner di Level, ulangi langkah uji stasioneritasnya tapi dengan data 1st difference (gambar 2). Untuk contoh yg saya berikan, semua variabelnya stasioner pada tahap ini (difference pertama), sehingga pada output berikutnya, nilai kolom Probability semua variabel berada di bawah 0.05.
philips perron difference

Misalkan saja ada kasus dimana 1 saja variabel tidak stasioner pada difference pertama seperti yg lain, maka kita harus men-difference-kan semua variabel lagi ke 2nd difference dan seterusnya, sampai semuanya stasioner.

II. Estimasi persamaan jangka panjang

Variabel-variabel yang ingin digunakan dan telah memenuhi syarat pada tahap 1, pada tahap ini akan dibuat persamaan regresinya, dengan Y sebagai variabel terikat sedangkan sisanya, semua sebagai variabel bebas. Kembali ke Workfile ECM, block lagi semua variabelnya pilih Open > as Equation..., setelah itu akan akan muncul window tempat kita mengisi persamaan. Tulis persamaannya persis seperti gambar di bawah:

Pilihan yang lain tidak perlu diubah, setelah tulis persamaan langsung klik OK. Berikutnya akan muncul output yang berisi estimasi dari koefisien2 tiap variabel bebas. Perhatikan nilai2 signifikansi yang dilingkari pada gambar di bawah:
output ecm


Cek nilai F-statistic (kotak hijau) lebih dulu, kalau memang sudah lebih kecil dari alpha (0.05), barulah bisa kita cek nilai signifikansi masing2 variabel (kotak biru). Signifikansi masinng2 variabel tidak harus semuanya berada di bawah 0.05, kalau di dalam suatu penelitian, hal tersebut tergantung pada kajian teorinya. Namun, apabila nilai probabilitas suatu variabel bebas berada di bawah 0.05, maka variabel bebas tersebut dikatakan berpengaruh terhadap variabel terikatnya.

III. Pengecekan Kointegrasi

Pada teori mengenai ECM sebelumnya telah dijelaskan bahwa kointegrasi suatu persamaan regersi dapat dilihat dari residualnya. Apabila residual stasioner, terdapat kointegrasi.
kointegrasi
Pada workfile ECM ada variabel dengan nama resid, yang merupakan tempat menyimpan residual persamaan yang baru saja diestimasi, sehingga nilainya berubah-ubah. Padahal residual persamaan jangka panjang, akan diuji stasioneritasnya dan digunakan sebagai variabel pada persamaan berikutnya. Oleh karena itu, langsung setelah estimasi persamaan jangka panjang, kita harus menyimpa residualnya dalam bentuk variabel baru yang tetap. Caranya adalah meng-generate variabel baru yg nilainya sama dengan variabel resid. Misal kita buat variabel baru tersebut dengan nama res menggunakan perintah seperti gambar di bawah lalu klik enter:

Variabel baru dengan nama res tersebut kemudian kita uji stasioneritasnya seperti pada langkah pertama, klik kanan di variabelnya, Open, di window baru pilih View > Unit root test, pilih tipe data Level  lalu klik OK. Apabila kolom Prob* berisi nilai di bawah alpha (0.05), maka kita bisa lanjut ke estimasi persamaan jangka pendek.
output kointegrasi


Output di atas memberikan informasi bahwa variabel res stasioner pada Level, dan secara tersirat menyatakan bahwa Y, X1, X2, X3, X4, X5, dan X6 sailing berkointegrasi.

IV. Estimasi persamaan jangka pendek

Pada tahap ini, buat lagi persamaan regresi menggunakan variabel-variabel sebelumnya (tapi yg sudah distasionerkan) ditambah variabel res (tahun sebelumnya). Caranya, munculkan lagi window untuk memasukkan persamaan dengan memilih "Estimation Equation..." yang ada pada menu Quick (paling atas). Setelah itu akan muncul tampilan:
estimasi jangka pendek

Karena variabel Y, X1, X2, X3, X4, X5, dan X6 stasioner pada difference pertama, gunakan transformasi variabel-variabel tersebut ke bentuk difference pertama dalam persamaan. Jangan lupa menyertakan variabel res(-1) yg merupakan residual pada tahun sebelumnya. Tuliskan persamaan persis seperti pada kotak merah gambar di atas lalu klik OK. Setelah itu akan muncul output sepert ini:
hasil jangka pendek

Untuk persamaan jangka pendek, pertama-tama pastikan nilai probabilitas F-statistic berada di bawah alpha (0.05). Setelah itu, cek speed of adjustment-nya (koefisien dari res(-1)). Nilai koefisien tersebut harus negatif dan signifikan (probabilitasnya berada di bawah 0.05). Barulah kemudian kita cek probabilitas masing-masing variabel, yg mana saja yang nilainya signifikan atau berada di bawah alpha (0.05), sama seperti pada persamaan jangka panjang.

V. Pengecekan Asumsi

Tahap ini sebenarnya adalah tahap yang harus ada untuk semua metode yang menggunakan regresi dalam proses analisisnya. Pada bagian teori ECM juga hanya disinggung sedikit karena nanti akan dibahas satu-satu beserta tutorialnya pada postingan yang berbeda.

VI. Interpretasi

Setelah seluruh tahap-tahap ECM terpenuhi kita mendapatkan 2 persamaan yang menjadi inti dari digunakan metode ini. Dari sinilah pengaruh variabel-variabel bebas terhadap variabel terikat yang ingin kita teliti, dapat dijelaskan.
Berdasarkan output persamaan jangka panjang, didapatkan:

Yt = -8.0993 + 0.7422 X1t* - 0.3207 X2t* + 0.9738 X3t* + 0.4464 X4t - 0.1172 X5t* - 0.0253 X6t

ket : (*) --> variabel yang signifikan (<0.05)
        (t) --> periode atau tahun 


Persamaan ini hanya dapat memberikan kita informasi bahwa dalam jangka panjang, X1, X2, X3, dan X5 berpengaruh signifikan terhadap Y.
Sedangkan dari output persamaan jangka pendek, didapatkan:

ΔYt = 0.0025 + 0.4157 ΔX1t* - 0.3156 ΔX2t* + 1.0558 ΔX3t* + 0.0816 ΔX4t - 0.0739 ΔX5t* - 0.0741 ΔX6t - 0.6899 RESt-1

Persamaan tersebut memberikan kita informasi bahwa dalam jangka pendek, X1, X2, X3, dan X5 berpengaruh signifikan terhadap Y.
  1. Kenaikan perubahan X1 sebesar 1 unit akan menyebabkan kenaikan perubahan Y sebesar 0.42 unit,
  2. Kenaikan perubahan X2 sebesar 1 unit akan menyebabkan penurunan perubahan Y sebesar 0.32 unit,
  3. Kenaikan perubahan X3 sebesar 1 unit akan menyebabkan kenaikan perubahan Y sebesar 1.06 unit, dan
  4. Kenaikan perubahan X5 sebesar 1 unit akan menyebabkan penurunan perubahan Y sebesar 0.07 unit
Berdasarkan nilai speed of adjustment, ada sebesar 69% ketidakseimbangan, pada pengaruh jangka pendek X1, X2, X3, X4, X5, dan X6 terhadap Y, yg terkoreksi setiap periodenya.
Written by: Nasrul Setiawan
STATISTIK CERIA, Updated at: 12:44 AM

 

Copyright @ 2013 Statistik Ceria