Logistic Regression AKA LOGIT!


LOGIT? Makanan apakah itu? Mendengar nama logit, biasanya yang terpintas adalah gambar berikut  ini lapis-legit 😀 😀 Tapi itu bukanlah LOGIT yang sedang kita perbincangkan kali ini. kali ini yang akan kita bahas adalah LOGIT : Logistic Regression

Apakah LOGIT itu?

logit adalah sebuah model yang menggunakan pendekatan logistik untuk menemukan persamaan regresi, bener ga sih? untuk lebih mudahnya mungkin seperti ini :

alkisah ada seorang pemilik franchise martabak ingin mengetahui apakah produk baru yang dijualnya, sebut saja “Martabak Green Tea” ini dipilih oleh khalayak umum dibandingkan dengan produk kompetitor yang sudah cukup mapan yaitu “Martabak Bangka”. jadi pemilik franchise ini ingin mengetahui apakah pilihan produk oleh konsumen dipengaruhi oleh tingkat promosi dan Perbandingan harga jual.

dari ilustrasi tersebut apakah yang dapat kita tangkap? yang dapat kita tangkap adalah bahwa si pemilik franchise ingin tahu apakah produknya ini lebih laku atau tidak dengan mempertimbangkan dua hal, yaitu promosi dan harga jual.   dari pernyataan ini kita bisa mendapatkan tiga informasi penting, yaitu :

  1. Kita bisa mendapatkan informasi variabel dependen, yaitu membeli martabak green tea atau tidak (dalam kasus ini jika tidak membeli martabak green tea maka konsumen memilih martabak bangka).
  2. kita mengetahui variabel independen pertama yaitu tingkat promosi, maksud dari tingkat promosi ini adalah skala penyebaran flyer yang dilakukan oleh dua kompetitor ini.
  3. kita mengetahui variabel independen kedua yaitu harga jual.

untuk mendukung rencana tersebut maka si pemilik memanggil seorang konsultan yang sudah handal di bidangnya dan terkenal seantero sumur bandung,sebut saja  Mr. Wo Fat  untuk membantu memecahkan permasalahan tersebut. Mr Wo Fat bersama tim nya mengumpulkan data-data aktual untuk mendukung rencana si pemilik tersebut. lalu apakah yang akan dilakukan selanjutnya? setelah data dikumpulkan maka Mr. Wo Fat melakukan analisis regresi sederhana, namun tidak disangka dan dinyana ternyata regresi tersebut sangat tidak familiar bagi pemilik ketika dipresentasikan. Mr. Wo Fat menjelaskan di presentasi tersebut bahwa untuk mencari hubungan antara semua variabel tersebut digunakan regresi biasa, namun tidak biasa.

KOK BISA?

Mr. Wo Fat dengan bangga menceritakan apa yang dia dan tim nya kerjakan selama ini, yaitu dia menggunakan regresi binomial AKA Logit! kira-kira beginilah penjelasan Mr. Wo Fat kepada pemilik franchise tersebut : “model biner ataupun LOGIT adalah model regresi yang variable dependent nya bersifat kualitatif  (terikat) dan hanya mempunyai dua kemungkinan nilai, misalnya kesuksesan (sukses – gagal), kesetujuan (setuju – tidak setuju), keinginan membeli (ya – tidak).” dengan kata lain model regresi yang menjadi pokok pembahasan adalah model yang menggunakan variabel biner sebagai variabel dependen, yaitu 0=membeli martabak green tea dan 1= membeli amrtabak bangka.

LAH KENAPA GA PAKE REGRESI BIASA?

pertanyaan tersebut terbesit di benak si pemilik franchise dan dengan senyum yang mengembang Mr. Wo Fat menjelaskan seperti ini: Jika menggunakan regresi linear biasa dengan kondisi variabel dependen adalah biner, maka asumsi distribusi normal tidak terpenuhi untuk model tersebut, hal ini dikarenakan regresi linear mengisyaratkan bahwa variabel dependen haruslah kontinyu dan jika variabel dependen adalah biner (0 dan 1) maka variabel dependen jika digambarkan dengan kurva menjadi terkumpul di dua titik sehingga tidak dapat dibuat garis regresi.

TERUS GIMANA CARA KERJANYA SIH REGRESI LOGIT?

si pemilik franchise kembali menanyakan pertanyaan yang lagi-lagi membuat Mr. Wo Fat tersenyum sumringah, dia pun menjawab seperti ini : pada dasarnya cara kerja LOGIT sama dengan regresi pada umumnya, dimulai dari

  • Spesifikasi

pada tahapan ini variabel-variabel yang akan di masukan ke dalam model dilakukan identifikasi dengan cara mencari studi literatur terhadap pengaruh variabel dependen dan independen, dalam kasus ini yang menjadi variabel dependen adalah keinginan konsumen untuk membeli atau tidak membeli martabak green tea dan variabel independen nya adalah tingkat promosi dan perbedaan harga.

  • Parameterisasi

sebelum melakukan parameterisasi, maka dilakukan estimasi model , biasanya di dalam software -software statistik digunakan estimasi Maximum Likelihood. Maximum Likelihood mengisyaratkan model untuk diubah ke dalam log-likelihood dan selanjutnya dicari gradien dan matriks Hessian nya menggunakan metode optimisasi untuk mencari nilai beta yang optimum. jika nilai parameter sama dengan nol maka variabel tersebut dikeluarkan dari model.

Lalu Mr Wo Fat memberikan hasil estimasi seperti berikut :

logit7

TERUS INTERPRETASI OUTPUT SOFTWARE  NYA?

pertanyaan tersebut tanpa sadar terucap oleh si pemilik dan langsung saja dijawab oleh Mr. Wo Fat :

Untuk interpretasi hasil dari software maka bisa dilihat nilai uji statistik G nya, perlu diingat bahwa uji statistik G ini hampir mirip seperti Chi-Square, caranya adalah dengan membandingkan hasil uji G dengan DOF (derajat kebebasannya,K-1) atau lebih mduahnya dengan melihat p-value dan membandingkan  hasil p-value tersebut dengan tingkat kepercayaan yang diinginkan (misal 5%).

Dari hasil output software didapatkan kesimpulan bahwa model regresi logistik secara keseluruhan dapat menjelaskan atau memprediksi keputusan konsumen dalam membeli martabak green tea. Data Z yang ada di ouptut merupakan hasil pembagian dari koefisien (beta) dibagi dengan standar error dari koefisien nya. Data Z ini diperlukan untuk mencari p-value dari tiap koefisien. tujuandari dicarinya p-valu eini adalah untuk mengethaui variabel independen mana aja yang punya andil atau bahasa ilmiahnya mungkin kaya gini, variabel independen mana yang mempunyai pengaruh signifikan terhadap Y?Uji ini dinamakan Uji Wald. Jika menggunakan tingkat kepercayaan sebesar 10% maka dari output dapat dilihat bahwa var X4_1 tidak signifikan, ini berarti variabel tersebut tidak dapat menjelaskan hubungan yang terjadi antara variabel tersebut dengan keinginan membeli martabak green tea ataupun martabak bangka.

lalu Mr. Wo Fat menjelaskan bahwa jika kita ingin membuat model persamaannya, maka model nya adalah seperti ini:

logit5

 

Namun yang menjadi permasalahan adalah bahwa model tersebut berbentuk non-linear sehingga perlu dirubah menjadi model yang linear dengan cara merubahd engan menggunakan logaritma natural (Ln)

logit6

Koefisien dalam model logit menunjukkan perubahan dalam logit sebagai akibat perubahan satu satuan variabel independen, namun sulit untuk mengintepretasikan nilai tersebut ke dalam matematis sehingga digunakan Odds Ratio. Variabel X2 merupakan tingkat promosi dan p-value dari variabel tersebut bernilai 0.9 ini berarti bahwa jika variabel dependen lain bernilai konstan maka jika promosi ditingkatkan sebesar 1 poin maka peluang untuk membeli martabak green tea adalah sebesar 0.9 kali dibandingkan dengan  tingkat promosi yang lebih rendah satu poin.

Kesimpulan akhir Mr. Wo Fat yang diberikan kepada pemilik adalah bahwa model yang telah dibuat adalah valid dan dapat melakukan prediksi untuk mengetahui apakah konsumen ingin membeli martabak green tea atau tidak dan tidak ada perbedaan signifikan antara pendapatan dengan pilihan membeli. Pada akhirnya yang diinginkan oleh si pemilik tercapai dengan merubah nilai dari variabel independen yang ada di dalam model,namun pertanyaan nya adalah bagaimana dengan error yang ada di dalam model? ah sudahlah pemilik tidak terlalu peduli dan biar saja menjadi rahasia Mr. Wo Fat sang konsultan.

~FIN~

 Referensi :

http://junaidichaniago.blogspot.com/2009/04/regresi-binary-logit-seri-6-model.html

*Dengan Perubahan.


Leave a Reply