Pada analisa regresi, bila peubah respon bukan lagi peubah (variabel) kuantitatif melainkan berupa peubah (variabel) kategorik yang hanya terdiri dari beberapa nilai maka regresi linear klasik tidak dapat digunakan. Adapun model regresi yang sering digunakan untuk menganalisis peubah respon berskala biner adalah REGRESI LOGISTIK.
Model regresi logistik termasuk dalam model linear terampat (Generalized Linear Models/GLM). GLM merupakan suatu metode yang dapat digunakan untuk memecahkan masalah peubah respon tidak lagi kontinu, melainkan kategorik (misalnya biner), dengan menggunakan fungsi penghubung (link function) tertentu sehingga diperoleh suatu model yang mampu menganalisa hubungan antara peubah respon kategorik (Dependen Variabel) dengan satu atau beberapa peubah penjelas (Independen Variabel).
Aplikasi dari analisa Regresi Logistik banyak digunakan untuk menghitung penyebab sebuah resiko dibidang bisnis maupun bidang kesehatan. Misalkan faktor-faktor apa saja yang menjadi penyebab sebuah kridit bank beresiko macet?, faktor-faktor apa saja yang menyebabkan resiko seseorang terkena penyakit Diabetes?
Contoh Kasus Bidang Bisnis:
Sebuah perusahaan pembiayaan sepeda motor ingin mengetahui faktor-faktor apa saja yang mempengaruhi sebuah kridit kendaraan dapat mengalami kemacetan. Data digunakan sampel sebanyak 35 peminjam untuk mencari penyebab dimana faktor-faktor yang dicurigai diantaranya, DP (Besar uang muka), jangka waktu pembayaran, umur peminjam dan pendidikan peminjam
Tabel diatas menunjukan nama variabel. Untuk variabel independen Kategorik seperti Dp (Uang Muka) dan Pendidikan diberi kode kategorinya dimana kategori yang diberi kode nol “0”, nantinya dijadikan sebagai Reference Category. Reference Category umumnya dipilih berdasarkan Kategori yang memiliki Resiko Paling Kecil seperti pendidikan Perguruan Tinggi, hal ini bertujuan untuk memudahkan dalam pembacaan hasil analisa. Untuk variabel dependen Status Kridit, kategori resiko diberi kode lebih besar dari pada kategori tidak beresiko.
PROSEDUR :
Analyze ==> Regression ==> Binary Logistic …
Muncul Menu Dialog berikut :
Masukan Variabel :
Status Kridit ke Dependent
Uang Muka , Jangka Waktu Pembayaran, Umur Pemohon dan Pendidikan ke Covariates
Klik Menu Categorical
Muncul Menu Dialog:
Klik Continue
Klik Menu Options..
Muncul Menu Dialog berikut :
Centang Hosmer-Lemeshow… dan CI for exp(B)..
Klik Continue
Klik OK
Hasil Analisa
Tabel Variabel In the Equation
Kolom Sig menginformasikan signifikan pengaruh variabel Independen terhadap Variabel Dependen. Terjadi pengaruh yang signifikan jika nilai sig < 0,05. Tampak variabel yang berpengaruh terhadap Macet/Tidak dari Kridit seorang Pemohon diantaranya dp (sig 0,040), Jangka_waktu (sig 0,032), dan pendidikan(2)/<= SMP (sig 0,029). Untuk pendidikan(1) merupakan kategori pendidiikan “SMA” dibanding dengan yang pendidikan “Perguruan Tinggi” (Reference Category) tidak signifikan berbeda resiko macetnya, namun dengan pendidikan(2) yang merupakan kategori pendidikan “<= SMP” ada perbedaan signifikan resiko macetnya dengan yang pendidikan “Perguruan Tinggi”
Kolom Exp(B) menginformasikan jensi pengaruh pada variabel yang berpengaruh signifikan. Jika nilainya diatas satu “1”, berarti resikonya lebih besar untuk Macet. Nilai Exp(B) pada variabel dp 15,474 yang artinya nilai dp <= 1,5 juta cenderung lebih beresiko mengalami macet jika dibandingkan dengan yang dp > 1,5 juta (reference Category-nya) sebesar 15,474 kali. Nilai Exp(B) pada variabel Jangka_waktu 0,869 yang artinya semakin lama Jangka_waktu pembayaran akan semakin kecil resiko untuk mengalami macet. Nilai Exp(B) pada variabel “pendidikan(2)” 15,818 yang artinya pemohon yang pendidikannya “<= SMP” lebih beresiko 15,818 mengalami macet jika dibandingkan dengan yang pendidikannya “Perguruan Tinggi”.
Tabel Hosmer and Lemeshow Test
Merupakan uji kelayakan model, dimana hipotesanya Ho: Model Layak dan H1: Model tdk Layak. Hasil uji menunjukan nilai Sig 0,404 yang artinya model Layak
Tabel Model Summary
Nilai Negelkerke R Square menunjukan nilai koefisien determinasi. Di dapat nilainya 0,571 yang artinya 57,1% pengaruh seluruh variabel independent terhadap variabel Dependen, dimana yang berpengaruh signifikan hanya variabel dp, jangka waktu pembayaran dan pendidikan.