Senin, 01 Agustus 2016

Contoh Laporan Analisis Regresi Simple

UAS Analisis Regresi
Permasalahan
Kecelakaan lalu lintas merupakan suatu peristiwa pada lalu lintas jalan yang tidak diduga dan tidak diinginkan yang sulit diprediksi kapan dan dimana terjadinya, sedikitnya melibatkan satu kendaraan dengan atau tanpa pengguna jalan lain yang menyebabkan cedera, trauma, kecacatan, kematian dan/atau kerugian harta benda pada pemiliknya (korban). Terjadinya kecelakaan lalu lintas tentunya dipengaruhi oleh beberapa faktor seperti, faktor pengemudi, faktor kondisi jalan, faktor kendaraan, pertambahan jumlah kendaraan bermotor, dan lain-lain.
Berdasarkan faktor-faktor tersebut maka akan dicari hubungan antara jumlah kecelakaan lalu lintas yang terjadi dengan faktor-faktor yang paling dominan berpengaruh terhadap jumlah kecelakaan lalu lintas seperti faktor pengemudi, kondisi jalan, kendaraan, dan pertambahan jumlah kendaraan bermotor.
Berikut adalah data jumlah kecelakaan lalu lintas, penyebab kecelakaan, dan pertambahan jumlah kendaraan bermotor dari tahun 1984-2014.
Tabel 1. Tabel data jumlah kecelakaan lalu lintas, faktor penyebab kecelakaan, dan pertambahan jumlah kendaraaan bermotor di dari tahun 1984-2014.
Tahun
Jumlah Kecelakaan
Lalu Lintas
(Kasus)
Faktor
Kendaraan
(Kasus)
Faktor
Pengemudi
(Orang)
Faktor
Jalan
(Kasus)
Pertambahan jumlah
kendaraan
bermotor (Unit)
1984
1153
197
629
12
2070
1985
1218
198
920
8
9246
1986
1066
48
814
16
3740
1987
1339
56
1033
37
5590
1988
939
26
764
12
13604
1989
619
23
500
22
9683
1990
597
17
487
71
8025
1991
570
17
439
16
10863
1992
526
7
457
4
8190
1993
503
9
488
3
12136
1994
614
12
560
4
16163
1995
527
10
509
6
16361
1996
419
9
403
7
21927
1997
469
5
458
3
24189
1998
337
4
330
3
17471
1999
221
1
219
1
7172
2000
237
5
230
1
31667
2001
154
5
138
7
25581
2002
179
5
163
3
54025
2003
201
3
192
5
57634
2004
232
5
220
7
53844
2005
325
12
260
16
71560
2006
1263
18
1220
13
120055
2007
1343
18
1209
35
105730
2008
1021
18
927
24
129932
2009
848
24
738
15
134669
2010
1380
30
851
330
200302
2011
1604
254
1209
134
209827
2012
7638
3593
1876
2011
203200
2013
5301
2870
1394
545
173467
2014
5993
2612
1380
1479
154585
Penyajian Data
 
· Mean atau rata-rata Jumlah kecelakaan lalu lintas dari tahun 1984-2014 adalah 1252,77 atau 1253 kasus dengan standar deviasi 1761,468. Jumlah seluruh kecelakaan lalu lintas dari tahun 1984-2014 yaitu 38.836 kasus dengan jumlah kecelakaaan lalu lintas tertinggi 7638 kasus pada tahun 2012 dan terendah 154 kasus pada tahun 2001.
· Mean atau rata-rata faktor kendaraan dari tahun 1984-2014 adalah 326,16 atau 326 kasus dengan standar deviasi 909,656. Jumlah seluruh faktor kendaraan dari tahun 1984-2014 yaitu 10.111 kasus dengan faktor kendaraan tertinggi 3593 kasus pada tahun 2012 dan terendah 1 kasus pada tahun 1999.
· Mean atau rata-rata faktor pengemudi dari tahun 1984-2014 adalah 677,97 atau 678 orang dengan standar deviasi 435,641. Jumlah seluruh faktor pengemudi dari tahun 1984-2014 yaitu 21.017 orang dengan jumlah faktor pengemudi tertinggi 1876 orang pada tahun 2012 dan terendah 138 kasus pada tahun 2001.
· Mean atau rata-rata faktor jalan dari tahun 1984-2014 adalah 156,45 atau 156 kasus dengan standar deviasi 443,739. Jumlah seluruh faktor jalan dari tahun 1984-2014 yaitu 4.850 kasus dengan jumlah kecelakaaan lalu lintas tertinggi 2011 kasus pada tahun 2012 dan terendah 1 kasus pada tahun 1999 dan tahun 2000.
· Mean atau rata-rata pertambahan jumlah kendaraan bermotor dari tahun 1984-2014 adalah 6,17x104 atau sekitar 61700 unit dengan standar deviasi 68.489,829. Jumlah seluruh pertambahan jumlah kendaraan bermotor dari tahun 1984-2014 yaitu 1.912.508 unit dengan pertambahan jumlah kendaraan bermotor tertinggi 209.827 unit pada tahun 2011 dan terendah 2070 unit pada tahun 1984.
 
Berdasarkan grafik di atas, terlihat bahwa jumlah kecelakaan lalu lintas di tertinggi terjadi pada tahun 2012 dengan jumlah kecelakaan lalu lintas sebesar 7638 kasus dan jumlah kecelakaan lalu lintas terendah yaitu pada tahun 2001 sebesar 154. Dari tahun 1990 sampai tahun 2005, jumlah kecelakaan lalu lintas mengalami penurunan. Namu pada tahun 2006 mengalami kenaikan. Kenaikan tertinggi tarjadi dari tahun 2011 ke tahun 2012. Pada tahun 2013 mengalami penurunan, kemudian naik lagi di tahun 2014.

Sebagaimana grafik diatas, faktor penyebab kecelakaan lalu lintas di yang paling sering terjadi disebabkan oleh faktor pengemudi yaitu sebesar 54%. Faktor kendaraan 26% dan faktor jalan 13%. Sedang faktor lainnya sebesar 7%.
Pembahasan Masalah
Akan dilakukan analisis regresi untuk mengetahui seberapa jauh hubungan antara faktor kendaraan, faktor pengemudi, faktor jalan, dan pertambahan jumlah kendaraan bermotor terhadap Jumlah kecelakaan lalu lintas, dengan variabel dependen adalah jumlah kendaraan lalu lintas, dan variabel independen adalah faktor kendaraan, faktor pengemudi, faktor jalan, dan pertambahan jumlah kendaraan bermotor. Analisis ini merupakan analisis regresi berganda.

Asumsi berdasarkan faktor kendaraan, faktor pengemudi, faktor jalan, dan pertambahan jumlah kendaraan bermotor terhadap jumlah kecelakaan lalu lintas yaitu
Jumlah kecelakaan lalu lintas : Y
Faktor kendaraan : X1
Faktor pengemudi : X2
Faktor jalan : X3
Pertambahan jumlah kendaraan bermotor : X4
 
Model regresi linier berganda berdasarkan asumsi-asumsi diatas adalah sebagai berikut :


Output SPSS 16.0 serta interpretasinya
Pemilihan Model Terbaik dengan Metode Backward
 
Berdasarkan output spss diatas dengan metode Backward, variabel independen yang berpengaruh secara signifikan (nilai signifikansi < 0,05) terhadap jumlah kecelakaan lalu lintas adalah faktor kendaraan, faktor pengemudi, dan faktor jalan. Nilai signifikansi dari pertambahan jumlah kendaraan bermotor lebih besar dari 0,05, maka dari itu pertambahan jumlah kendaraan bermotor tidak berpengaruh secara signifikan terhadap jumlah kecelakaan lalu lintas. Sedangkan nilai signifikansi dari faktor kendaraan, faktor pengemudi, dan faktor jalan yaitu 0,000 (kurang dari 0,05) artinya ketiga variabel bebas tersebut berpengaruh secara signifikan terhadap jumlah kecelakaan lalu lintas. Oleh karena itu didapatkan model terbaik dengan metode Backward yaitu:
 
Penjelasan :
Untuk setiap penambahan 1 unit variabel bebas X1, maka akan terjadi penambahan untuk Y sebesar 1,151. Untuk setiap penambahan 1 unit variabel bebas X2, maka akan terjadi penambahan untuk Y sebesar 1,079. Untuk setiap penambahan 1 unit variabel bebas X3, maka akan terjadi penambahan untuk Y sebesar 0,831.

Sebagaimana pada tabel Model Summary diatas, terlihat bahwa nilai koefisien korelasi untuk model regresi dengan metode Backward adalah 0,999 yang berarti 99,9% hubungan antara variabel independen faktor jalan, faktor pengemudi, dan faktor kendaraan dengan variabel dependen jumlah kecelakaan lalu lintas. Begitu juga nilai koefisien determinasi yaitu 0,997 yang berarti bahwa 99,7% variabel independen faktor jalan, faktor pengemudi, dan faktor kendaraan dapat menjelaskan variabel dependen jumlah kecelakaan lalu lintas dalam model regresi.

Uji Asumsi Klasik 
Uji asumsi klasik adalah persyaratan yang harus dipenuhi pada analisis regresi linier berganda yang berbasi Ordinary Least Square (OLS). Evaluasi ini di maksudkan untuk mengetahui apakah penggunaan model regresi linier berganda dalam menganalisis telah memenuhi asumsi klasik. Ada empat pengujian asumsi klasik yang akan di uji, yaitu uji normalitas, uji multikolinearitas, uji heteroskedastisitas, dan uji autokorelasi.

1. Uji Normalitas
Asumsi Normalitas dalam asumsi klasik ini adalah nilai residual yang di bentuk model regresi linier terdistribusi normal, bukan variabel bebas ataupun variabel terikatnya. Uji Normalitas digunakan untuk menguji apakah nilai residual yang dihasilkan dari regresi terdistribusi normal atau tidak. Model regresi yang baik adalah yang memiliki nilai residual yang berdistribusi normal.

Hasil uji normalitas pada gambar Normal P-P Plot di bawah ini.

Sebagaimana terlihat dalam grafik Normal P-P Plot of Regression Standardized Residual, terlihat bahwa titik-titik menyebar disekitar garis diagonal, serta penyebarannya mengikuti arah garis diagonal (membentuk garis lurus), maka dapt dikatakan bahwa data berdistribusi normal dan model regresi layak di pakai untuk memprediksi Y berdasarkan variabel bebasnya.

Hasil uji Normalitas pada gambar grafik One-Sample Kolmogorov Smirnov di bawah ini.

Sebagaimana terlihat dalam tabel Kolmogorov Smirnov, terlihat bahwa nilai signifikansi diatas 0,05 ( 0,153 lebih besar dari 0,05), maka nilai residual dalam model regresi berdistribusi normal.

2. Uji Heteroskedastisitas
Asumsi Heterokedastisitas adalah asumsi nilai residual dari model regresi yang memiliki varian tidak konstan. Pada pemeriksaan ini, diharapkan asumsi Heteroskedatisitas tidak terpenuhi karena model regresi linier berganda memiliki asumsi varian residual yang konstan (Homoskedastisitas). Uji heteroskedastisitas digunakan untuk mengetahui ada atau tidaknya penyimpangan asumsi klasik heteroskedastisitas yaitu adanya ketidaksamaan varian dari residual untuk semua pengamatan pada model regresi.
Ada beberapa metode pengujian yang bisa digunakan diantaranya yaitu dengan pendekatan scatterplots regresi, uji koefisien korelasi spearmen, dan beberapa uji lainnya.
a. Pendekatan pada scatterplots regresi
Metode ini yaitu dengan cara melihat grafik scatterplot antara standardized predicted value (ZPRED) dengan studentized residual (SRESID). Ada tidaknya pola tertentu pada grafik scatterplot antara SRESID dan ZPRED dimana sumbu Y adalah Y yang telah di prediksi dan sumbu X adalah residual (Y prediksi - Y sesungguhnya).
Hasil Uji Heterokedastisitas pada gambar grafik scatterplot di bawah ini.
Gambar 5. Uji Heterokedastisitas dengan Grafik Scatterplot 
 
Sebagaimana terlihat pada grafik scatterplot diatas, terlihat bahwa titik-titik tidak membentuk pola yang jelas, dan tidak menyebar diatas dan dibawah angka 0 pada sumbu Y. Maka dapat disimpulkan bahwa tidak terjadi heterokedastisitas dalam model regresi.
b. Uji Koefisien Korelasi Spearmen's rho
Metode uji heterokedastisitas dengan korelasi Spearmen's rho yaitu mengkorelasikan variabel bebas dengan nilai unstandardized residual. Pengujian menggunakan tingkat signifikansi 5% dengan uji 2 sisi. Apabila korelasi antara variabel independen dengan residual di dapat signifikansi lebih dari , maka tidak terjadi heterokedastisitas pada model regresi.
Hasil Uji Heterokedastisitas dengan Uji Korelasi Spearmen dibawah ini.
Gambar 6. Uji Heterokedastisitas dengan Uji Korelasi Spearmen
 
Sebagaimana terlihat pada tabel Koefisien Korelasi Spearmen diatas, terlihat bahwa nilai korelasi ketiga variabel bebas dengan Unstandardized Residual (nilai residual) memiliki nilai signifikansi diatas 0,01 (0,054, 0,671, dan 0,070 lebih dari 0,05), maka dapat disimpulkan bahwa tidak terjadi heterokedastisitas pada model regresi.

3. Uji Multikolinearitas
Asumsi Multikolinearitas adalah asumsi yang menunjukkan adanya hubungan linier yang kuat diantara beberapa variabel bebas dalam suatu model regresi linier berganda. Uji multikolinearitas digunakan untuk melihat ada atau tidaknya korelasi (keterkaitan) yang tinggi antara variabel-variabel bebas dalam suatu model regresi linear berganda.
Salah satu cara untuk memeriksa terjadinya multikolinearitas adalah dengan pemeriksaan Variance Inflation Factor (VIF). Apabila nilai VIF lebih dari 10, maka terjadi multikoliearitas. Sebaliknya, apabila nilai VIF kurang dari 10, maka tidak terjadi multikolinearitas.

Sebagaimana terlihat pada tabel diatas, nilai VIF untuk semua variabel bebas kurang dari 10, maka tidak terjadi multikolinearitas antara variabel bebas.

4. Uji Autokorelasi
Asumsi autokorelasi adalah asumsi residual yang memiliki kompenen/nilai yang berkorelasi berdasarkan waktu (urutan waktu) pada himpunan data itu sendiri.
Uji autokorelasi digunakan untuk melihat apakah terjadi korelasi antara suatu periode t dengan periode sebelumnya (t-1). Ukuran dalam menentukan ada tidaknya masalah autokorelasi dengan uji Durbin-Watson (DW), dengan ketentuan sebagai berikut:
Jika DW lebih besar dari 2 atau lebih kecil dari -2, maka terjadi autokorelasi. Sebaliknya, jika DW berada diantara -2 dan 2 ( -2 < DW < 2 ), maka tidak terjadi autokorelasi.

Sebagaimana tabel model summary diatas, terlihat bahwa nilai Durbin-Watson 1,253 (kurang dari 2), maka model diatas tidak terjadi autokorelasi.

Kesimpulan
Karena semua uji asumsi klasik terpenuhi, maka model regresi dengan metode Backward yaitu dapat digunakan untuk menduga kecelakaan lalu lintas yang terjadi.

Tidak ada komentar:

Posting Komentar