LAPORAN STATISTIKA
PERBANDINGAN ANALISIS REGRESI DENGAN MENGGUNAKAN PERANGKAT LUNAK SPSS 16
DAN R SERTA KELEBIHAN DAN KEKURANGAN DENGAN PENGGUNAAN KEDUANYA
NIM H1091141026
Data keuntungan Penjualan (Y) suatu produk yang di
pengaruhi oleh jenis promosi
PEMBAHASAN
1. Pendahuluan
Analisis
data cross section yang tepat untuk
digunakan pada data tersebut adalah analisis regresi linier berganda dengan
empat variabel bebas. Program statistik R dan SPSS16 adalah program statistik
yang dapat digunakan untuk menganalisis data tersebut. Selanjutnya akan
dilakukan uji analisis regresi linier berganda empat variabel bebas dengan
kedua program tersebut.
2. Langkah-langkah
Analisis Regresi
a. Model
Analisis Regresi
Akan dilakukan analisis regresi untuk mengetahui seberapa
jauh hubungan antara faktor iklan koran, faktor iklan tv, faktor iklan radio,
dan faktor jumlah outlet terhadap keuntungan penjualan, dengan variabel
dependen adalah keuntungan penjualan, dan variabel independen adalah faktor
iklan koran, faktor iklan tv, faktor iklan radio, dan faktor jumlah outlet.
Analisis ini merupakan analisis regresi berganda.
Asumsi berdasarkan faktor iklan koran, faktor iklan tv,
faktor iklan radio, dan faktor jumlah outlet terhadap keuntungan penjualan
yaitu :
Keuntungan penjualan :
Y
Faktor iklan koran : X1
Faktor iklan tv : X2
Faktor iklan radio : X3
Jumlah Outlet :
X4
Model regresi linier berganda empat variabel berdasarkan
asumsi-asumsi diatas adalah sebagai berikut :
b. Analisis
Regresi dengan Program Statistik R dan SPSS 16
1) Sekilas
tentang Program Statistik R dan SPSS 16
Program
statistik R adalah salah satu dari kelompok software
statistik open source atau freeware. Program ini juga merupakan
salah satu alternatif penyelesaian dari mahalnya lisensi program statistik yang
komersil seperti SPSS, dll. Fungsi dan kemampuan dari R sebagian besar dapat
diperoleh melalui Add-on packages/library.
Library R-commander merupakan library tambahan dari R yang dapat
digunakan untuk berbagai analisis statistika dasar.
SPSS
atau Statistical Product and Service
Solutions merupakan program yang khusus untuk olah data statistik. Program
ini merupakan kelompok software
komersil yang populer di Indonesia.
2) Hasil
dan Pembahasan Analisis Regresi dengan R dan SPSS 16
Selanjutnya
akan dilakukan analisis regresi dengan menu yang disediakan oleh R-commander, yaitu Regresi Linier. Untuk
menganalisis ini, R-commander
menyediakan fasilitas menu Statistika,
pilih Pencocokan Model, dan setelah
itu pilih Regresi Linier. Setelah
muncul kotak dialog Regresi Linier,
pilih variabel dependen dan independennya, pilik OK.
Berikut
adalah output dari regresi linier berganda empat variabel.
|
>
RegModel.1 <- lm(Penjualan~Iklan.koran+iklan.radio+iklan.tv+jumlah.outlet,
+ data=datauts)
>
summary(RegModel.1)
Call:
lm(formula
= Penjualan ~ Iklan.koran + iklan.radio + iklan.tv +
jumlah.outlet, data = datauts)
Residuals:
Min
1Q Median 3Q
Max
-18.5578 -7.6792
0.4525 6.9027 24.0036
Coefficients:
Estimate Std. Error t value
Pr(>|t|)
(Intercept) -378.5777 30.7689 -12.304 7.43e-12 ***
Iklan.koran 1.4315 0.6118
2.340 0.0279 *
iklan.radio 1.1152 0.9504
1.173 0.2521
iklan.tv 20.1775 1.0390
19.421 3.48e-16 ***
jumlah.outlet -3.6113
1.4809 -2.439 0.0225 *
---
Signif.
codes: 0 '***' 0.001 '**' 0.01 '*'
0.05 '.' 0.1 ' ' 1
Residual
standard error: 11.73 on 24 degrees of freedom
Multiple
R-squared: 0.9778, Adjusted R-squared: 0.9741
F-statistic:
264.5 on 4 and 24 DF, p-value: <
2.2e-16
|
Output regresi linier berganda dengan R
Output regresi linier berganda dengan SPSS 16
Berdasarkan
output R dan SPSS 16 diatas, terlihat bahwa model regresi linier berganda yang
dihasilkan keduanya belum signifikan karena terdapat variabel independen yang
tidak berpengaruh terhadap variabel dependennya. Variabel independen yang
berpengaruh secara signifikan (p-value atau
sig. < 0,05) terhadap keuntungan
penjualan (Y) adalah faktor iklan koran (X1), faktor iklan tv (X2),
dan jumlah outlet (X4). Nilai signifikansi dari faktor iklan radio
(X3) lebih besar dari 0,05 (p-value
atau sig. > 0,05), maka dari itu
faktor iklan radio tidak berpengaruh secara signifikan terhadap keuntungan
penjualan.
Karena
model regresi linier berganda diatas belum signifikan, akan dilakukan pemilihan
model regresi linier berganda terbaik dengan metode Backward. Berikut adalah output regresi linier berganda dengan
metode Backward.
|
>
stepwise(RegModel.1, direction='backward', criterion='AIC')
Direction: backward
Criterion: AIC
Start: AIC=147.32
Penjualan
~ Iklan.koran + iklan.radio + iklan.tv + jumlah.outlet
Df Sum of Sq RSS
AIC
-
iklan.radio 1 190
3493 146.94
<none> 3303 147.32
-
Iklan.koran 1 754
4057 151.28
-
jumlah.outlet 1 818
4122 151.75
-
iklan.tv 1 51911 55215 227.00
Step: AIC=146.94
Penjualan
~ Iklan.koran + iklan.tv + jumlah.outlet
Df Sum of Sq RSS
AIC
<none> 3493 146.94
-
Iklan.koran 1 662
4155 149.97
-
jumlah.outlet 1 758
4251 150.64
-
iklan.tv 1 54605 58098 226.47
Call:
lm(formula
= Penjualan ~ Iklan.koran + iklan.tv + jumlah.outlet,
data = datauts)
Coefficients:
(Intercept) Iklan.koran iklan.tv jumlah.outlet
-367.060 1.327 20.387 -3.463
>
RegModel.2 <- lm(Penjualan~Iklan.koran+iklan.tv+jumlah.outlet,
data=datauts)
>
summary(RegModel.2)
Call:
lm(formula
= Penjualan ~ Iklan.koran + iklan.tv + jumlah.outlet,
data = datauts)
Residuals:
Min
1Q Median 3Q
Max
-21.062 -8.069
-1.836 7.631 24.235
Coefficients:
Estimate Std. Error t value
Pr(>|t|)
(Intercept) -367.0600 29.3803 -12.493 3.01e-12 ***
Iklan.koran 1.3275 0.6099
2.177 0.0392 *
iklan.tv 20.3869 1.0312
19.770 < 2e-16 ***
jumlah.outlet -3.4629
1.4866 -2.329 0.0282 *
---
Signif.
codes: 0 '***' 0.001 '**' 0.01 '*'
0.05 '.' 0.1 ' ' 1
Residual
standard error: 11.82 on 25 degrees of freedom
Multiple
R-squared: 0.9765, Adjusted R-squared: 0.9737
F-statistic:
346.9 on 3 and 25 DF, p-value: <
2.2e-16
|
Output regresi linier berganda metode Backward dengan R
Output regresi linier berganda metode Backward dengan SPSS 16
Pada
output R dengan metode Backward
terlihat bahwa nilai Start AIC pada step pertama diperoleh 147,32,
namun nilai AIC pada faktor iklan radio (X3) 146,94. Maka faktor
iklan radio akan di hilangkan pada model. Setelah itu, pada step kedua, nilai
AIC sebesar 146,94 begitu juga nilai AIC dari <none> atau konstanta 146,97, maka konstanta dapat dimasukkan
kedalam model.
Berdasarkan
output diatas, terlihat bahwa pada model regresi 2 baik dari output R maupun
SPSS 16 nilai statistik F yaitu 346,9 dengan nilai signifikansi lebih kecil
dari 0,05 (p-value atau sig. < 0,05), artinya seluruh varibel
independennya mempengaruhi variabel dependen secara signifikan dengan 97,4%
variabel dependennya dapat dijelaskan oleh variabel independennya (Adjusted R-squared = 0,974). Model
regresi 2 ini sudah signifikan seluruh variabel independen berpengaruh secara
signifikan (p-value atau sig. < 0,05) terhadap variabel
dependen keuntungan penjualan (Y). Oleh karena itu, didapatkan model terbaik
dengan R yaitu :
Penjelasan :
Untuk
setiap penambahan 1 unit variabel independen X1 (faktor iklan
koran), maka akan terjadi penambahan untuk Y (keuntungan penjualan) sebesar
1,3275. Untuk setiap penambahan 1 unit variabel independen X2
(faktor iklan tv), maka akan terjadi penambahan untuk Y (keuntungan penjualan)
sebesar 20,3869. Dan Untuk setiap penambahan 1 unit variabel independen X1
(faktor iklan koran), maka akan terjadi pengurangan untuk Y (keuntungan
penjualan) sebesar -3,4629.
3) Uji
Asumsi Klasik Model Regresi Terbaik dengan R dan SPSS 16
Model
regresi linier berganda akan lebih tepat digunakan dan menghasilkan perhitungan
yang lebih akurat apabila memenuhi asumsi-asumsi klasik. Asumsi-asumsi klasik
yang akan diberikan adalah Normalitas, Heterokedastisitas, dan Autokorelasi.
a) Uji
Nomalitas
Uji
normalitas dilakukan untuk mengetahui apakah nilai residual yang dihasilkan
dari regresi berdistribusi normal atau tidak. Model regresi yang baik adalah
yang memiliki nilai residual yang berdistribusi normal.
Untuk
uji normalitas dengan QQ-Plot disediakan oleh R-commader, yaitu pilih menu Model,
selanjutnya pilih Grafik dan setelah
itu pilih Perbandingan Kuartil/QQ Plot
sisa. Setelah muncul kotak dialog QQ-Plot
Sisa, pilih OK.
Uji
normalitas dengan SPSS 16 disediakan pada Normal PP-Plot.
Berikut
adalah output QQ-Plot residual dari model regresi 2.
Output QQ-Plot residual dengan R
Output PP-Plot residual dengan SPSS 16
Sebagaimana
terlihat dalam grafik QQ-Plot dan PP-Plot diatas, terlihat bahwa titik-titik
menyebar disekitas garis diagonal, serta penyebarannya mengikuti arah garis
diagonal, maka dapat dikatakan bahwa data residual berdistribusi normal.
Untuk
menguatkannya, akan dilakukan uji normalitas dengan Shapiro-Wilk dengan R dan
SPSS 16.
Pada
R-commander, pengujian dapat
dilakukan dengan menggunakan menu Statistika,
pilih Ringkasan, kemudian pilih Uji Kenormalan Shapiro-Wilk. Setelah
muncul kotak dialog Shapiro-Wilk Test
for Normality, pilih peubah residuall,
kemudian klik OK.
Pada
SPSS 16 dapat dilakukan dengan menu Analyze,
pilih Descriptive Statistics, pilih Explore. Setelah muncul kotak dialog Explore, pada kotak Dependent List, masukkan variabel
residualnya, pada menu Plot, berikan
centang pada Normality Plot with Tests.
Selanjutnya pilih Continue, klik OK.
Berikut
adalah output uji normalitas dengan Shapiro-Wilk.
|
>
residuall=resid(RegModel.2)
>
shapiro.test(residuall)
Shapiro-Wilk normality test
data: residuall
W =
0.9841, p-value = 0.9275
|
Output uji normalitas Shapiro-Wilk dengan R
Output uji normalitas Shapiro-Wilk dengan SPSS 16
Pengujian
Hipotesis
1.
Hipotesis
Uji
Ho
: Data berdistribusi normal
H1
: Data tidak berdistribusi normal
2.
Taraf
Signifikansi
α
= 5% = 0,05.
3.
Daerah
kritis
Ho
ditolak jika p-value < 0,05.
4.
Kesimpulan
Berdasakan
kedua output diatas, terlihat bahwa nilai Shapiro-Wilk 0,9841 dengan nilai
signifikansi 0,9275 lebih besar dari 0,05 (p-value
> 0,05), maka Ho diterima. Artinya nilai residual dalam model
regresi 2 berdistribusi normal.
b) Uji
Heterokedastisitas
Uji
heterokedastisitas digunakan untuk mengetahui apakah adanya ketidaksamaan
varian dari residual untuk semua pengamatan pada model regresi. Model regresi
yang baik mempunyai nilai residual yang memiliki varian tidak konstan.
Uji
heterokedastisitas dapat menggunakan dengan R menggunakan Uji Breusch-Pagan
yang disediakan oleh R-commander.
Untuk menganalisisnya, dapat dilakukan dengan perintah menu Model, pilih Diagnostik Numerik, selanjutnya pilih Uji Breusch-Pagan untuk Heterokedastisitas. Setelah muncul kotak
dialog Uji Breusch-Pagan, tambahkan
centang pada Uji Statistika Student,
pilih formula variansi Nilai Pengepasan,
kemudian klik OK.
Uji
heterokedastisitas dengan SPSS 16 tersedia pada grafik scatterplot antara standardized predicted value (ZPRED)
dengan studentized residual (SRESID).
Berikut
adalah output Uji Breusch-Pagan untuk Heterokedastisitas.
|
>
bptest(Penjualan ~ Iklan.koran + iklan.tv + jumlah.outlet, varformula = ~
+ fitted.values(RegModel.2),
studentize=TRUE, data=datauts)
studentized Breusch-Pagan test
data: Penjualan ~ Iklan.koran + iklan.tv +
jumlah.outlet
BP =
0.4953, df = 1, p-value = 0.4816
|
Output uji heterokedastisitas
Breusch-Pagan dengan R
Output uji heterokedastisitas Scatterplot dengan SPSS 16
Pengujian
Hipotesis
1.
Hipotesis
Uji
Ho
: Tidak terjadi heterokedastisitas.
H1
: Terjadi heterokedastisitas.
2.
Taraf
Signifikansi
α
= 5% = 0,05.
3.
Daerah
kritis
Ho
ditolak jika p-value < 0,05.
4.
Kesimpulan
Berdasarkan
output R diatas, terlihat bahwa nilai Breusch-Pagan 0,4953 dengan nilai
signifikansi 0,4816 lebih besar dari 0,05 (p-value
atau sig. > 0,05), maka Ho
diterima. Dapat dikatakan nilai residual dari model regresi 2 memiliki varian
yang tidak konstan. Artinya, tidak terjadi heterokedastisitas dalam model
regresi.
Begitu
juga dengan output SPSS 16, terlihat bahwa titik-titik tidak membentuk pola
yang jelas, dan tidak menyebar diatas dan dibawah angka 0 pada sumbu Y. Maka
dapat disimputkan bahwa tidak terjadi heterokedastisitas dalam model regresi 2.
c) Uji
Multikolinearitas
Uji
multikolinearitas dilakukan untuk mengetahui ada atau tidaknya korelasi yang
tinggi antara variabel-variabel bebas dalam suatu model regresi linier
berganda. Model regresi yang baik memiliki variabel-variabel bebas yang
independen atau tidak berkorelasi.
Uji
multikolinearitas dapat dilakukan pada R dengan fasilitas yang di sediakan R-commander, pilih menu Model, kemudian pilih Diagnostik Numerik, selanjutnya pilih Faktor Inflasi Variansi (FIV).
Uji
multikolineritas dengan SPSS 16 dapat dilihat nilai FIV pada tabel Coefficients
regresi linier berganda.
Berikut
adalah output dari uji multikolinearitas.
|
>
vif(RegModel.2)
Iklan.koran iklan.tv jumlah.outlet
2.351985 2.246133 1.159625
|
Output uji multikolineritas dengan R
Output uji multikolineritas dengan SPSS 16
Sebagaimana
terlihat pada kedua output diatas, terlihat bahwa semua variabel independen
pada model regresi 2 mempunyai nilai VIF kurang dari 5, maka tidak adanya
korelasi antara seluruh variabel independennya. Artinya tidak terjadi
multikolinearitas antara variabel independen pada model regresi 2.
d) Uji
Autokorelasi
Uji
autokorelasi digunakan untuk mengetahui apakah residual memiliki kompenen/nilai
yang berkorelasi berdasarkan waktu. Model regresi yang baik memiliki nilai residual
yang tidak memiliki korelasi berdasarkan waktu.
Uji
autokorelasi dapat dilakukan melalui R-commander
dengan menu Model, pilih Diagnostik Numerik, selanjutnya pilih Uji Durbin Watson untuk Otokorelasi.
Setelah muncul kotak dialog Durbin-Watson
Test, pilh centang rho !=0,
kemudian klik OK.
Uji
autokorelasi dengan SPSS 16 dapat dilihat melalui nilai Durbin-Watson pada tabel Model
Summary.
Berikut
adalah output uji Durbin-Watson pada model regresi 2.
|
>
dwtest(Penjualan ~ Iklan.koran + iklan.tv + jumlah.outlet,
+ alternative="two.sided",
data=datauts)
Durbin-Watson test
data: Penjualan ~ Iklan.koran + iklan.tv +
jumlah.outlet
DW =
1.7836, p-value = 0.4223
alternative
hypothesis: true autocorrelation is not 0
|
Output uji autokorelasi dengan R
Pengujian
Hipotesis
1.
Hipotesis
Uji
Ho
: Tidak terjadi autokorelasi.
H1
: Terjadi autokorelasi.
2.
Taraf
Signifikansi
α
= 5% = 0,05.
3.
Daerah
kritis
Ho
ditolak jika p-value < 0,05.
4.
Kesimpulan
Output uji autokorelasi dengan SPSS 16
Berdasarkan
pada kedua output diatas, terlihat bahwa nilai Durbin-Watson pada model regresi
2 sebesar 1,7836 dengan nilai signifikansi 0,4223 lebih besar dari 0,05 (p-value > 0,05), maka Ho
di terima. Artinya nilai residual tidak memiliki korelasi berdasarkan waktu
atau tidak terjadi autokorelasi pada model regresi 2.
c. Keunggulan
dan Kekurangan dari Program Statistik R dan SPSS 16
1) Keunggulan
dan Kekurangan dengan menggunakan program R
a) Keunggulan
(1)
Output
lebih mudah dipelajari dan dipahami.
(2)
Output
tidak memakai banyak ruang.
(3)
Output
lebih kearah penjelasan data, buka tabel-tabel.
(4)
Untuk
uji asumsi klasik, tersedianya menu Model yang memudahkan pengolahan ujinya.
b) Kekurangan
(1)
Kesulitan
dalam memasukkan data yang banyak karena harus mengimpor terlebih dahulu data
dari Excel.
(2)
Harus
mempelajari syntax terlebih dahulu.
(3)
Kesulitan
saat akan melakukan pemilihan model terbaik.
2) Keunggulan
dan Kekurangan dengan menggunakan program SPSS 16
a) Keunggulan
(1)
Kemudahan dalam memasukkan data
(2)
Kemudahan dalam melakukan pengolahan
data yaitu hanya dengan memilih uji statistik yang sudah tersedia.
(3)
Cepat dalam menampilkan output
(4)
Output yang mudah dibaca karena sudah
terbiasa.
b) Kekurangan
(1)
Output
terlalu banyak tabel.
(2)
Pemilihan
uji untuk uji asumsi klasik harus dipelajari terlebih dahulu.
Perlu sedikit keahlian dalam pengolahan data statistik.
Tidak ada komentar:
Posting Komentar