Jumat, 16 Desember 2016

PERBANDINGAN ANALISIS REGRESI DENGAN MENGGUNAKAN PERANGKAT LUNAK SPSS 16 DAN R SERTA KELEBIHAN DAN KEKURANGAN DENGAN PENGGUNAAN KEDUANYA



LAPORAN STATISTIKA
PERBANDINGAN ANALISIS REGRESI DENGAN MENGGUNAKAN PERANGKAT LUNAK SPSS 16 DAN R SERTA KELEBIHAN DAN KEKURANGAN DENGAN PENGGUNAAN KEDUANYA
NIM H1091141026
Data keuntungan Penjualan (Y) suatu produk yang di pengaruhi oleh jenis promosi

PEMBAHASAN
1.      Pendahuluan
Analisis data cross section yang tepat untuk digunakan pada data tersebut adalah analisis regresi linier berganda dengan empat variabel bebas. Program statistik R dan SPSS16 adalah program statistik yang dapat digunakan untuk menganalisis data tersebut. Selanjutnya akan dilakukan uji analisis regresi linier berganda empat variabel bebas dengan kedua program tersebut.
2.      Langkah-langkah Analisis Regresi
a.      Model Analisis Regresi
Akan dilakukan analisis regresi untuk mengetahui seberapa jauh hubungan antara faktor iklan koran, faktor iklan tv, faktor iklan radio, dan faktor jumlah outlet terhadap keuntungan penjualan, dengan variabel dependen adalah keuntungan penjualan, dan variabel independen adalah faktor iklan koran, faktor iklan tv, faktor iklan radio, dan faktor jumlah outlet. Analisis ini merupakan analisis regresi berganda.
Asumsi berdasarkan faktor iklan koran, faktor iklan tv, faktor iklan radio, dan faktor jumlah outlet terhadap keuntungan penjualan yaitu :
Keuntungan penjualan           : Y
Faktor iklan koran                  : X1
Faktor iklan tv                        : X2
Faktor iklan radio                   : X3
Jumlah Outlet                         : X4
Model regresi linier berganda empat variabel berdasarkan asumsi-asumsi diatas adalah sebagai berikut :

b.      Analisis Regresi dengan Program Statistik R dan SPSS 16
1)      Sekilas tentang Program Statistik R dan SPSS 16
Program statistik R adalah salah satu dari kelompok software statistik open source atau freeware. Program ini juga merupakan salah satu alternatif penyelesaian dari mahalnya lisensi program statistik yang komersil seperti SPSS, dll. Fungsi dan kemampuan dari R sebagian besar dapat diperoleh melalui Add-on packages/library. Library R-commander merupakan library tambahan dari R yang dapat digunakan untuk berbagai analisis statistika dasar.
SPSS atau Statistical Product and Service Solutions merupakan program yang khusus untuk olah data statistik. Program ini merupakan kelompok software komersil yang populer di Indonesia.
2)      Hasil dan Pembahasan Analisis Regresi dengan R dan SPSS 16
Selanjutnya akan dilakukan analisis regresi dengan menu yang disediakan oleh R-commander, yaitu Regresi Linier. Untuk menganalisis ini, R-commander menyediakan fasilitas menu Statistika, pilih Pencocokan Model, dan setelah itu pilih Regresi Linier. Setelah muncul kotak dialog Regresi Linier, pilih variabel dependen dan independennya, pilik OK.
Berikut adalah output dari regresi linier berganda empat variabel.
> RegModel.1 <- lm(Penjualan~Iklan.koran+iklan.radio+iklan.tv+jumlah.outlet,
+   data=datauts)

> summary(RegModel.1)

Call:
lm(formula = Penjualan ~ Iklan.koran + iklan.radio + iklan.tv +
    jumlah.outlet, data = datauts)

Residuals:
     Min       1Q   Median       3Q      Max
-18.5578  -7.6792   0.4525   6.9027  24.0036

Coefficients:
               Estimate Std. Error t value Pr(>|t|)   
(Intercept)   -378.5777    30.7689 -12.304 7.43e-12 ***
Iklan.koran      1.4315     0.6118   2.340   0.0279 * 
iklan.radio      1.1152     0.9504   1.173   0.2521   
iklan.tv        20.1775     1.0390  19.421 3.48e-16 ***
jumlah.outlet   -3.6113     1.4809  -2.439   0.0225 * 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 11.73 on 24 degrees of freedom
Multiple R-squared:  0.9778,     Adjusted R-squared:  0.9741
F-statistic: 264.5 on 4 and 24 DF,  p-value: < 2.2e-16
Output regresi linier berganda dengan R
Output regresi linier berganda dengan SPSS 16
Berdasarkan output R dan SPSS 16 diatas, terlihat bahwa model regresi linier berganda yang dihasilkan keduanya belum signifikan karena terdapat variabel independen yang tidak berpengaruh terhadap variabel dependennya. Variabel independen yang berpengaruh secara signifikan (p-value atau sig. < 0,05) terhadap keuntungan penjualan (Y) adalah faktor iklan koran (X1), faktor iklan tv (X2), dan jumlah outlet (X4). Nilai signifikansi dari faktor iklan radio (X3) lebih besar dari 0,05 (p-value atau sig.  > 0,05), maka dari itu faktor iklan radio tidak berpengaruh secara signifikan terhadap keuntungan penjualan.
Karena model regresi linier berganda diatas belum signifikan, akan dilakukan pemilihan model regresi linier berganda terbaik dengan metode Backward. Berikut adalah output regresi linier berganda dengan metode Backward.
> stepwise(RegModel.1, direction='backward', criterion='AIC')

Direction:  backward
Criterion:  AIC

Start:  AIC=147.32
Penjualan ~ Iklan.koran + iklan.radio + iklan.tv + jumlah.outlet

                Df Sum of Sq   RSS    AIC
- iklan.radio    1       190  3493 146.94
<none>                        3303 147.32
- Iklan.koran    1       754  4057 151.28
- jumlah.outlet  1       818  4122 151.75
- iklan.tv       1     51911 55215 227.00

Step:  AIC=146.94
Penjualan ~ Iklan.koran + iklan.tv + jumlah.outlet

                Df Sum of Sq   RSS    AIC
<none>                        3493 146.94
- Iklan.koran    1       662  4155 149.97
- jumlah.outlet  1       758  4251 150.64
- iklan.tv       1     54605 58098 226.47

Call:
lm(formula = Penjualan ~ Iklan.koran + iklan.tv + jumlah.outlet,
    data = datauts)

Coefficients:
  (Intercept)    Iklan.koran       iklan.tv  jumlah.outlet 
     -367.060          1.327         20.387         -3.463 

> RegModel.2 <- lm(Penjualan~Iklan.koran+iklan.tv+jumlah.outlet, data=datauts)

> summary(RegModel.2)

Call:
lm(formula = Penjualan ~ Iklan.koran + iklan.tv + jumlah.outlet,
    data = datauts)

Residuals:
    Min      1Q  Median      3Q     Max
-21.062  -8.069  -1.836   7.631  24.235

Coefficients:
               Estimate Std. Error t value Pr(>|t|)   
(Intercept)   -367.0600    29.3803 -12.493 3.01e-12 ***
Iklan.koran      1.3275     0.6099   2.177   0.0392 * 
iklan.tv        20.3869     1.0312  19.770  < 2e-16 ***
jumlah.outlet   -3.4629     1.4866  -2.329   0.0282 * 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 11.82 on 25 degrees of freedom
Multiple R-squared:  0.9765,     Adjusted R-squared:  0.9737
F-statistic: 346.9 on 3 and 25 DF,  p-value: < 2.2e-16
Output regresi linier berganda metode Backward dengan R




Output regresi linier berganda metode Backward dengan SPSS 16
Pada output R dengan metode Backward terlihat bahwa nilai Start AIC pada step pertama diperoleh 147,32, namun nilai AIC pada faktor iklan radio (X3) 146,94. Maka faktor iklan radio akan di hilangkan pada model. Setelah itu, pada step kedua, nilai AIC sebesar 146,94 begitu juga nilai AIC dari <none> atau konstanta 146,97, maka konstanta dapat dimasukkan kedalam model.
Berdasarkan output diatas, terlihat bahwa pada model regresi 2 baik dari output R maupun SPSS 16 nilai statistik F yaitu 346,9 dengan nilai signifikansi lebih kecil dari 0,05 (p-value atau sig.  < 0,05), artinya seluruh varibel independennya mempengaruhi variabel dependen secara signifikan dengan 97,4% variabel dependennya dapat dijelaskan oleh variabel independennya (Adjusted R-squared = 0,974). Model regresi 2 ini sudah signifikan seluruh variabel independen berpengaruh secara signifikan (p-value atau sig. < 0,05) terhadap variabel dependen keuntungan penjualan (Y). Oleh karena itu, didapatkan model terbaik dengan R yaitu :
Penjelasan :
Untuk setiap penambahan 1 unit variabel independen X1 (faktor iklan koran), maka akan terjadi penambahan untuk Y (keuntungan penjualan) sebesar 1,3275. Untuk setiap penambahan 1 unit variabel independen X2 (faktor iklan tv), maka akan terjadi penambahan untuk Y (keuntungan penjualan) sebesar 20,3869. Dan Untuk setiap penambahan 1 unit variabel independen X1 (faktor iklan koran), maka akan terjadi pengurangan untuk Y (keuntungan penjualan) sebesar -3,4629.


3)      Uji Asumsi Klasik Model Regresi Terbaik dengan R dan SPSS 16
Model regresi linier berganda akan lebih tepat digunakan dan menghasilkan perhitungan yang lebih akurat apabila memenuhi asumsi-asumsi klasik. Asumsi-asumsi klasik yang akan diberikan adalah Normalitas, Heterokedastisitas, dan Autokorelasi.
a)      Uji Nomalitas
Uji normalitas dilakukan untuk mengetahui apakah nilai residual yang dihasilkan dari regresi berdistribusi normal atau tidak. Model regresi yang baik adalah yang memiliki nilai residual yang berdistribusi normal.
Untuk uji normalitas dengan QQ-Plot disediakan oleh R-commader, yaitu pilih menu Model, selanjutnya pilih Grafik dan setelah itu pilih Perbandingan Kuartil/QQ Plot sisa. Setelah muncul kotak dialog QQ-Plot Sisa, pilih OK.
Uji normalitas dengan SPSS 16 disediakan pada Normal PP-Plot.
Berikut adalah output QQ-Plot residual dari model regresi 2.
Output QQ-Plot residual dengan R
Output PP-Plot residual dengan SPSS 16
Sebagaimana terlihat dalam grafik QQ-Plot dan PP-Plot diatas, terlihat bahwa titik-titik menyebar disekitas garis diagonal, serta penyebarannya mengikuti arah garis diagonal, maka dapat dikatakan bahwa data residual berdistribusi normal.
Untuk menguatkannya, akan dilakukan uji normalitas dengan Shapiro-Wilk dengan R dan SPSS 16.
Pada R-commander, pengujian dapat dilakukan dengan menggunakan menu Statistika, pilih Ringkasan, kemudian pilih Uji Kenormalan Shapiro-Wilk. Setelah muncul kotak dialog Shapiro-Wilk Test for Normality, pilih peubah residuall, kemudian klik OK.
Pada SPSS 16 dapat dilakukan dengan menu Analyze, pilih Descriptive Statistics, pilih Explore. Setelah muncul kotak dialog Explore, pada kotak Dependent List, masukkan variabel residualnya, pada menu Plot, berikan centang pada Normality Plot with Tests. Selanjutnya pilih Continue, klik OK. 
Berikut adalah output uji normalitas dengan Shapiro-Wilk.
> residuall=resid(RegModel.2)
> shapiro.test(residuall)
   Shapiro-Wilk normality test

data:  residuall
W = 0.9841, p-value = 0.9275
Output uji normalitas Shapiro-Wilk dengan R
Output uji normalitas Shapiro-Wilk dengan SPSS 16
Pengujian Hipotesis
1.      Hipotesis Uji
Ho : Data berdistribusi normal
H1 : Data tidak berdistribusi normal
2.      Taraf Signifikansi
α = 5% = 0,05.
3.      Daerah kritis
Ho ditolak jika p-value < 0,05.
4.      Kesimpulan
Berdasakan kedua output diatas, terlihat bahwa nilai Shapiro-Wilk 0,9841 dengan nilai signifikansi 0,9275 lebih besar dari 0,05 (p-value > 0,05), maka Ho diterima. Artinya nilai residual dalam model regresi 2 berdistribusi normal.
b)     Uji Heterokedastisitas
Uji heterokedastisitas digunakan untuk mengetahui apakah adanya ketidaksamaan varian dari residual untuk semua pengamatan pada model regresi. Model regresi yang baik mempunyai nilai residual yang memiliki varian tidak konstan.
Uji heterokedastisitas dapat menggunakan dengan R menggunakan Uji Breusch-Pagan yang disediakan oleh R-commander. Untuk menganalisisnya, dapat dilakukan dengan perintah menu Model, pilih Diagnostik Numerik, selanjutnya pilih Uji Breusch-Pagan untuk Heterokedastisitas. Setelah muncul kotak dialog Uji Breusch-Pagan, tambahkan centang pada Uji Statistika Student, pilih formula variansi Nilai Pengepasan, kemudian klik OK.
Uji heterokedastisitas dengan SPSS 16 tersedia pada grafik scatterplot antara standardized predicted value (ZPRED) dengan studentized residual (SRESID).
Berikut adalah output Uji Breusch-Pagan untuk Heterokedastisitas.
> bptest(Penjualan ~ Iklan.koran + iklan.tv + jumlah.outlet, varformula = ~
+   fitted.values(RegModel.2), studentize=TRUE, data=datauts)

   studentized Breusch-Pagan test

data:  Penjualan ~ Iklan.koran + iklan.tv + jumlah.outlet
BP = 0.4953, df = 1, p-value = 0.4816
Output uji heterokedastisitas Breusch-Pagan dengan R
Output uji heterokedastisitas Scatterplot dengan SPSS 16
Pengujian Hipotesis
1.      Hipotesis Uji
Ho : Tidak terjadi heterokedastisitas.
H1 : Terjadi heterokedastisitas.
2.      Taraf Signifikansi
α = 5% = 0,05.
3.      Daerah kritis
Ho ditolak jika p-value < 0,05.
4.      Kesimpulan
Berdasarkan output R diatas, terlihat bahwa nilai Breusch-Pagan 0,4953 dengan nilai signifikansi 0,4816 lebih besar dari 0,05 (p-value atau sig. > 0,05), maka Ho diterima. Dapat dikatakan nilai residual dari model regresi 2 memiliki varian yang tidak konstan. Artinya, tidak terjadi heterokedastisitas dalam model regresi.
Begitu juga dengan output SPSS 16, terlihat bahwa titik-titik tidak membentuk pola yang jelas, dan tidak menyebar diatas dan dibawah angka 0 pada sumbu Y. Maka dapat disimputkan bahwa tidak terjadi heterokedastisitas dalam model regresi 2.
c)      Uji Multikolinearitas
Uji multikolinearitas dilakukan untuk mengetahui ada atau tidaknya korelasi yang tinggi antara variabel-variabel bebas dalam suatu model regresi linier berganda. Model regresi yang baik memiliki variabel-variabel bebas yang independen atau tidak berkorelasi.
Uji multikolinearitas dapat dilakukan pada R dengan fasilitas yang di sediakan R-commander, pilih menu Model, kemudian pilih Diagnostik Numerik, selanjutnya pilih Faktor Inflasi Variansi (FIV).
Uji multikolineritas dengan SPSS 16 dapat dilihat nilai FIV pada tabel Coefficients regresi linier berganda.
Berikut adalah output dari uji multikolinearitas.
> vif(RegModel.2)
  Iklan.koran      iklan.tv jumlah.outlet
     2.351985      2.246133      1.159625
Output uji multikolineritas dengan R
Output uji multikolineritas dengan SPSS 16
Sebagaimana terlihat pada kedua output diatas, terlihat bahwa semua variabel independen pada model regresi 2 mempunyai nilai VIF kurang dari 5, maka tidak adanya korelasi antara seluruh variabel independennya. Artinya tidak terjadi multikolinearitas antara variabel independen pada model regresi 2.
d)     Uji Autokorelasi
Uji autokorelasi digunakan untuk mengetahui apakah residual memiliki kompenen/nilai yang berkorelasi berdasarkan waktu. Model regresi yang baik memiliki nilai residual yang tidak memiliki korelasi berdasarkan waktu.
Uji autokorelasi dapat dilakukan melalui R-commander dengan menu Model, pilih Diagnostik Numerik, selanjutnya pilih Uji Durbin Watson untuk Otokorelasi. Setelah muncul kotak dialog Durbin-Watson Test, pilh centang rho !=0, kemudian klik OK.
Uji autokorelasi dengan SPSS 16 dapat dilihat melalui nilai Durbin-Watson pada tabel Model Summary.
Berikut adalah output uji Durbin-Watson pada model regresi 2.
> dwtest(Penjualan ~ Iklan.koran + iklan.tv + jumlah.outlet,
+   alternative="two.sided", data=datauts)

   Durbin-Watson test

data:  Penjualan ~ Iklan.koran + iklan.tv + jumlah.outlet
DW = 1.7836, p-value = 0.4223
alternative hypothesis: true autocorrelation is not 0
Output uji autokorelasi dengan R
Pengujian Hipotesis
1.      Hipotesis Uji
Ho : Tidak terjadi autokorelasi.
H1 : Terjadi autokorelasi.
2.      Taraf Signifikansi
α = 5% = 0,05.
3.      Daerah kritis
Ho ditolak jika p-value < 0,05.
4.      Kesimpulan
Output uji autokorelasi dengan SPSS 16
Berdasarkan pada kedua output diatas, terlihat bahwa nilai Durbin-Watson pada model regresi 2 sebesar 1,7836 dengan nilai signifikansi 0,4223 lebih besar dari 0,05 (p-value > 0,05), maka Ho di terima. Artinya nilai residual tidak memiliki korelasi berdasarkan waktu atau tidak terjadi autokorelasi pada model regresi 2.
c.       Keunggulan dan Kekurangan dari Program Statistik R dan SPSS 16
1)      Keunggulan dan Kekurangan dengan menggunakan program R
a)      Keunggulan
(1)   Output lebih mudah dipelajari dan dipahami.
(2)   Output tidak memakai banyak ruang.
(3)   Output lebih kearah penjelasan data, buka tabel-tabel.
(4)   Untuk uji asumsi klasik, tersedianya menu Model yang memudahkan pengolahan ujinya.
b)     Kekurangan
(1)   Kesulitan dalam memasukkan data yang banyak karena harus mengimpor terlebih dahulu data dari Excel.
(2)   Harus mempelajari syntax terlebih dahulu.
(3)   Kesulitan saat akan melakukan pemilihan model terbaik.
2)      Keunggulan dan Kekurangan dengan menggunakan program SPSS 16
a)      Keunggulan
(1)   Kemudahan dalam memasukkan data
(2)   Kemudahan dalam melakukan pengolahan data yaitu hanya dengan memilih uji statistik yang sudah tersedia.
(3)   Cepat dalam menampilkan output
(4)   Output yang mudah dibaca karena sudah terbiasa.
b)     Kekurangan
(1)   Output terlalu banyak tabel.
(2)   Pemilihan uji untuk uji asumsi klasik harus dipelajari terlebih dahulu.
Perlu sedikit keahlian dalam pengolahan data statistik.

Tidak ada komentar:

Posting Komentar