Regresi Logistik [Logistic Regression]

Regresi logistik berguna untuk meramalkan ada atau tidaknya karakteristik berdasarkan prediksi seperangkat prediktor. Regresi logistik seperti yang ditulis dalam Diskusi Metodologi Penelitian, mirip dengan model regresi linier tetapi cocok untuk model penelitian dengan variabel dependen yang datanya berbentuk dikotomis.

 Koefisien regresi logistik dapat digunakan untuk memperkirakan odds ratio untuk setiap variabel independen dalam model. Odd ratio adalah adalah ukuran dari peningkatan kemungkinan untuk satu kategori dibandingkan dengan yang lain. Melalui odd ratio kita akan tahu berapa peningkatan skor variabel dependen yang ditinjau oleh prediktor tertentu ketika prediktor lainnya adalah konstan.

Regresi logistik digunakan untuk memprediksi variabel yang bersifat kategoris (biasanya dikotomis) oleh seperangkat variabel prediksi. Dengan adanya sifat variabel yang kategorikal, analisis fungsi diskriminan biasanya digunakan jika semua prediktor berbentuk data kontinum dan terdistribusi dengan baik. Analisis logit digunakan jika semua prediktor bersifat kategoris; dan regresi logistik dipilih jika prediktor memuat campuran variabel kontinu dan kategoris atau prediktor tersebut tidak terdistribusi yang baik (regresi logistik tidak membuat asumsi tentang distribusi dari variabel prediktor).

Regresi logistik telah sangat populer untuk riset medis misalnya apakah pasien memiliki gejala penyakit tertentu. Pada regresi logistik, variabel dependen yang diprediksi adalah fungsi dari probabilitas bahwa suatu subjek tertentu akan berada dalam salah satu kategori.

Contoh Desain Penelitian

  1. Misalkan kita tertarik pada faktor-faktor yang mempengaruhi apakah seorang kandidat politik akan memenangkan pemilihan atau tidak. Hasil (respon) variabel dikotomi (0 dan 1); menang atau kalah. Prediktor yang dipakai adalah: jumlah uang yang dihabiskan untuk kampanye, jumlah waktu yang digunakan untuk kampanye negatif dan apakah atau tidak calon adalah sebuah kewajiban. Karena variabel respon biner kita harus menggunakan sebuah model yang menangani 0 / 1 variabel dengan benar.
  2. Peneliti hendak mengidentifikasi pengaruh usia, jenis kelamin dan aktivitas olahraga kemunculan serangan jantung. Variabel respon kemunculan serangan jantung berbentuk data dikotomi (0 dan 1) yaitu muncul dan tidaknya serangan jantung.
  3. Peneliti hendak mengindentifikasi GRE (Graduate Record Exam skor), IPK (Indeks Prestasi Kumulatif), dan prestise program sarjana untuk mendaftarkan diri pada program pascasarjana. Skor pada variabel dependennya berbentuk dikotomi (0 dan 1) yaitu mendaftar program pascasarjana atau tidak.

Binary Logistic Regression memberikan kesempatan kepada peneliti untuk menentukan model secara fleksibel dan mendalam serta memilih prediktor secara inklusif. Peneliti dapat menggunakan enam jenis metode (forward- or backward-stepwise dsb.) Hal ini memungkinkan peneliti untuk menemukan prediktor yang terbaik dari seperangkat prediktor yang dipakai. Karena peneliti metode forward (prosedur memilih prediktor terkuat hingga terlemah) atau backward (prosedur mengeluarkan prediktor yang paling kuat secara berurutan), peneliti mempunyai fleksibilitas untuk memilih model dengan cara yang mereka inginkan. Peneliti juga dapat mengatur kriteria untuk melakukan inklusi maupun ekslusi terhadap prediktor yang dilibatkan.

Konsiderasi Data

Variabel dependen harus berbentuk dikotomi sedangkan prediktor dapat berbentuk interval atau kategoris. Jika kategoris, mereka harus di dummy atau dikodekan.

Asumsi
Regresi logistik tidak bergantung pada asumsi distribusi namun disarankan data memenuhi distribusi normal multivariat karena akan menghasilkan prediksi yang lebih stabil. Sebagai bagian dari regresi, adanya multikolinieritas antar prediktor dapat menyebabkan bias estimasi dan pelambungan nilai eror standar. Prosedur akan lebih efektif jika prediktor yang benar-benar merupakan variabel kategoris bukan merupakan pengkategorian berdasarkan kualitas misalnya “IQ tinggi” dan “IQ rendah”. Jika variabel dependennya merupakan variabel kontinum seperti IQ maka peneliti disarankan untuk menggunakan regresi linier karena akan menghasilkan informasi lebih kaya. Dengan kata lain, jika variabel dependennya adalah kontinum (misalnya IQ) pengkategorian tidak perlu dilakukan.

Prosedur Terkait
Gunakan prosedur untuk sebar layar multicollinearity data Anda. Jika asumsi multivariat normal dan sama matriks varians-kovarians terpenuhi peneliti akan mendapatkan solusi yang lebih cepat jika menggunakan prosedur Analisis Diskriminan. Jika semua prediktornya variabel kategoris, peneliti dapat menggunakan prosedur Loglinear. Jika variabelnya adalah kontinu maka penggunaan prosedur Regresi Linear sangat disarankan.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: