STATISTIK KORELASI DAN REGRESI
BAB I
PENDAHULUAN
A.
LATAR
BELAKANG
Analisis statistika bertjuan untuk mengetahui apakah ada hubungan
antara dua tau lebih variabel. Hubungan demikian ini dapat dinyatakan dalam
bentuk rumus matematik, maka kita akan dapat menggunakannya untuk keperluan
peramalan.
Masalah peramalan dapat di lakukan dengan menerapkan persamaan
regresi, mendekati nilai tengah populasi. Istilah regresi di tetapkan pada
semua peramalan, dan tidak harus berimplikasi suatu regresi mendekati nilai
tengahpopulasi. Sedangkan teknik korelasi merupakan teknikk analisis yang
melihat kecenderungan pola dam variabel berdasarkan kecenderungan pola dalam
variabel yang lain apakah naik atau turun atau tidak menentu, jika
kecenderungan dalam satu variabel selalu di ikuti variabel lain, kita dapat
mengatakan bahwa kedua variabel ini mempunyai hubungan atau korelasi.
BAB II
B.
PEMBAHASAN
1.1
PENGERTIAN
STATISTIK ATAU STATISTIKA
Secara etimologis kata statistika berasal dari kata status (Bahasa
latin) atau kata staat (bahasa belanda); dalam Bahasa Indonesia kata
tersebut diterjemahkan menjadi Negara.
Dalam kamus Bahasa Indonesia, statistika diartikan dalam dua arti: pertama,
Statistika sebagai “ilmu statistika”, dan kedua, statistika
diartikan sebagai “ukuran yang diperoleh atau berasal dari sampel,” yaitu
sebagai lawan dari kata “parameter” yang berarti ukuran yang diperoleh atau
berasal dari populasi. Dalam hal pengertian sebagai ukuran yang diperoleh dari
sampel sering disebut dengan istilah statistik.
Statistik, diartikan
sebagai kumpulan fakta yang berbentuk angka-angka yang disusun dalam bentuk
daftar atau tabel yang menggambarkan suatu persoalan. Kata statistik dipakai
untuk menyatakan kumpulan data bilangan, maupun bilangan yang disusun dalam
tabel atau diagram yang melukiskan atau menggambarkan suatu persoalan. Statistika
sebagai “pengetahuan yang
berhubungan dengan cara-cara mengumpulkan data, pengolahan atau
penganalisisannya dan penarikan kesimpulan berdasarkan kumpulan data dan
penganalisisan yang telah dilakukan”[1].
Statistika dapat diartikan sebagai ilmu pengetahuan yang mempelajari tentang bagaimana cara kita
mengumpulkan, mengolah, menganalisis, dan menginterpretasiakan data sehingga
dapat disajikan dengan lebih baik dan dapat ditarik kesimpulan.
Statistika juga dapat diartikan seperangkat metode yang membahas
tentang:
1)
Bagaimana
cara mengumpulkan data yang dapat memberikan informasi yang optimal,
2)
Bagaimana
cara meringkas, mengolah, dan menyajikan data,
3)
Bagaimana
cara melakukan analisis terhadap sekumpulan data, sehingga dari analisis itu
timbul strategi-strategi tertentu,
4)
Bagaimana
cara mengambil kesimpulan dan menyarankan keputusan yang sebaiknya diambil,
atas dasar strategi yang ada,
5)
Bagaimana
menentukan besarnya resiko kekeliruan yang mungkin terjadi jika mengambil
keputusan atasdasar strategi tersebut.
a.
Klarifikasi
Statistika
Ø Pembagian Statistika Berdasarkan Cara Pengolahan Data
1.
Statistika
Deskriptif
Statistika deskriptif atau statistika deduktif, merupakan
statistika yang mempelajari cara pengumpulan data dan penyajian data sehinga
mudah dipahami. Statistika deskriptif hanya berhubungan dengan hal menguraikan
atau memberikan keterangan-keterangan mengenai suatu data atau fenomena. Dengan
kata lain hanya berfungsi menerangkan keadaan, gejala atau persoalan.
Penarikan kesimpulan pada
statistika deskriptif (jika ada) hanya di tunjukkan pada kumpulan data yang
ada. Didasarkan atas ruang lingkup bahasannya.
2.
Statistika
Infensial
Statistika infensial disebut pula statistika induktif adalah
statistika yang mempelajari mengenai penafsiran dan penarikan kesimpulan yang
berlaku secara umum dari data sampel yang tersedia. Statistika infensial
berhubungan dengan pendugaan populasi dan pengujian hipotesis dari suatu data
atau keadaan atau fenomena. Dengan kata lain, statistika infensial berfungsi
meramalkan dan mengotrol keadaan atau kejadian.
Penarikan kesimpulan pada statistika infensial ini merupakan
generalisasi dari suatu populasi berdasarkan data (sampel) yang ada. Statistika
intensial biasanya digunakan untuk membuat generalisasi dari kaitan anatara 2
(dua) atau lebih fenomena atau variabel.
Secara garis besar, kaitan antara 2 (dua) atau lebih venomina atau variabel
dapat di bedakan atas dua (2) bentuk kaitan, kaitan yaitu asosiasi (hubungan)
dan komparasi (perbandingan).
Sedangkan di tinjau dari teknik uji statistika yang dapat
digunakan, statistic inferensial dibedakan atas: statistika parametik dan
statistika non-parametik. Statistik parametik merupakan teknik uji statistika
yang merupakan parameter variabel/objek secara langsung. Sedangkaaan statistika
non-parametik merupakan teknik uji statistika yang dilakukan terhadap sisi lain
dari parameter suatu variabel/objek yang akan dikaji.
Ø Pembagian Statistik Berdasarkan Ruang lingkup penggunaannya
1)
Statistika
pendidikan
Yaitu
statistika yang digunakan atau diterapkan pada bidang atau disiplin ilmu
pendidikan.
2)
Statistika
Sosial
Yaitu
statistika yang digunakan atau diterapkan pada bidang atau disiplin ilmu
sosial.
3)
Statistika
Kesehatan
Yaitu
statistika yang digunakan atau diterapkan pada bidang atau disiplin ilmu
kesehatan.
4)
Satatistika
Ekonomi
Yaitu
statistika yang digunakan atau diterapkan pada bidang atau disiplin ilmu
ekonomi.
5)
Statistika
Pertanian
Yaitu
statistika yang digunakan atau diterapkan pada bidang atau disiplin ilmu
pertanian.
6)
Statistika
bidang lainnya.
Ø Karakteristik Statistika
-
Statistika
selalu bekerja dengan angka atau bilangan yang disebut dengan data kuantatif.
Hal ini dimaksudkan apabila statistika dipergunakan sebagai alat analisis bagi
data kualitatif (bahan/bilangan yang tidak berwujud angka atau bilangan), maka
data kualitatif tersebut harus diubah atau dikonversikan terlebih dahulu
menjadi data kuantitatif, (data ini disebut kuantitatifkan.
-
Statistika
bersifat obyektif
Kesimpulan dan ramalan
yang dihasilkan oleh statistika didasarkan pada angka yang diolah (obyektif)
dan tidak didasarkan pengaruh dari luar (subyektif).
-
Statistika
Bersifat universal
Ruang lingkup
ststistika tidaklah sempit, ruanglingkupnya sangat luas bagi kehidupan manusia
baik dibidang perdagangan, pertanian, kependudukan, pendidikan, dan sebagainya.
Ø Peranan, Fungsi dan Kegunaan Statistika
a.
Peranan
Statistika
Pada era globalisasi, hamper semua
bidang tidak terlepas dengan menggunakan angka, data dan fakta. Hal ini menunjukkan
bahwa statistika sangat dibutuhkan. Ststistika sebagai sarana mengembangkan
cara berpikir logis, lebih dari itu statsitika mengembangkan berpikir secara
ilmiah untuk merencanakan (forcasting) penyelidikan, menyimpulkan dan
membuat keputusan yang teliti dan meyakinkan. Baik disadari atau tidak,
statistika merupakan bagian substansi dari latihan professional dan menjadi
landasan dari kegiatan-kegiatan penelitian. Peranan statistika dalam berbagai
kegiatan manusia antara lain, dalam aktivitas kehidupan sehari-hari, dalam ilmu
pengetahuan dan dalam aktivitas penelitian ilmiah.
b. Fungsi Statistika
Satatistika membantu seseorang untuk
mengumpulkan, mengolah, menganalisa, dan menyimpulkan hasil yang telah dicapai
dalam kegiatan tertentu. Dalam hal ini statistika sebagai alat bantu. Sedangkan
menurut Hasan (2008) statistika berfungsi sebagai:
1)
Bank
data, yaitu menyediakan data untuk diolah dan diinterpresentasikan agar dapat
dipakai untuk menerangkan keadaan yang perlu diketahui atau diungkap.
2)
Alat
quality control, yaitu sebagai alat pembantu standarisasi dan sekaligus
sebagai alat pengawas.
3)
Pemecahan
masalah dan pembuatan keputusan sebagai dasar penetapan kebijakan dan langkah
lain untuk lebih lanjut mempertahankan dan mengembangkan suatu lembaga dalam
pemberian pelayanan dan sebagainya.
c. Kegunaan Statistika
Banyak manfaat dan kegunaan statistika diantaranya:[2]
1)
Memperoleh
gambaran, baik gambaran secara umum maupun secara khusus tentang suatu gejala,
peristiwa/ atau obyek.
2)
Mengikuti
perkembangan/ pasang surut mengenai gejala, keadaan atau peristiwa dari waktu
ke waktu.
3)
Melakukan
pengujian, apakah gejala yang satu berbeda dengan gejala yang lainnya ataukah
tidak; jika terdapat perbedaan apakah perbedaan itu merupakan perbedaan yang
berarti (meyakinkan) ataukah perbedaan itu terjadi hanya karena kebetulan.
4)
Mengetahui
apakah gejala yang satu ada hubungan dengan gejala yang lainnya.
5)
Menyusun
laporan yang berupa data kuantitatif dengan teratur, ringkas dan jelas.
6)
Menarik
kesimpulan secara logis, mengambil keputusan secara tepat dan mantap, serta
dapat diperkirakan atau meramalkan hal-hal yang mungkin terjadi dimasa
mendatang.
1.2
MENGENAL
KORELASI
Korelasi merupakan teknik
analisis yang termasuk dalam salah satu teknik pengukuran asosiasi / hubungan (measures
of association). Pengakuan asosiasi merupakan istilah umum yang mengacu
pada sekelompok teknik dalam statistic bivariate yang di gunnakan untuk
mengukur kekuatan hubungan antara dua variabel. Diantara sekian banyak
teknik-teknik pengukuran asosiasi terdapat dua teknik korelasi yang sangat
popular sampai sekarang, yaitu Korelasi Pearson Product Moment dan Korelasi
Rank Spearman. Pengukuran asosiasi mengenakan nilai numerik untuk mengetahui
tingkatan asosiasi atau kekuatan hubungan antara variabel. Dua variabel
dikatakan berasosiasi jika perilaku variabel yang satu mempengaruhi variabel
yang lain. Jika tidak terjadi pengaruh, maka kedua variabel tersebut disebut
independen.
Korelasi bermanfaat untuk mengukur kekuatan hubungan antara dua
variabel atau lebih dengan skala-skala tertentu, misanya pearson data harus
bersekala interval atau rasio. Spearman dan Kendal menggunakan skala ordinal.
Kuat lemahnya hubungan di ukur menggunakan jarak (range) 0 sampai dengan 1.
Korelasi mempunyai kemungkinan pengujian hipotesis dua arah (two tailed).
Dikatakan korelasi searah jika koefesien korelasi ditemukan positif,
sebalikanya jika koefisien korelasinya ditemukan negative maka di katakana
korelasi tidak searah.
Yang dimaksud koefesien korelasi ialah suatu pengukuran statistic
kovariasi atau asosiasi antara dua variabel. Jika koefesian korelasi
diketemukan tidak sama dengan nol (0), maka terdapat hubungan antara dua
variabel tersebut. Jika koefesien diketemukan +1, maka hubungan tersebut
disebut hubungan korelasi sempurna atau hubungan linear sempurna dengan
emiringan (slope) positif. Sebalikanya, jika koefesien diketemukan -1, maka
hubungan tersebut disebut hubungan korelasi sempurna atau hubungan linear
sempurna dengan kemiringan (slope) negatif.
Dalam korelasi sempurna tidak diperlukan lavi pengujian hipotesis mengenai
signifikasi antara variabel yang dikorelasikan, karena kedua variabel mempunyai
dua hubungan linear yang sempurna. Artinya variabel X mempunyai hubungan sangat
kuat dengan variabel Y. jika korelasi sam dengan nol (0), maka tidak terdapat
hubungan antara kedua variabel.
Pengukuran asosiasi berguna untuk mengukur kekuatan (strength)
dan arah hubungan-hubungan antar dua variabel atau lebih. Contoh: mengukur
hubungan antar dua variabel: 1) Motivasi kerja dengan produktifitas; 2)
Kualitas layanan dengan kepuasan pelanggan; 3) Tingkat inflasi dengan IHSG.
1.3 KEGUNAAN KORELASI
Pengukuran ini membahas hubungan antar dua variabel untuk
masing-masing kasus akan menghasilkan keputusan, diantaranya:
a). Hubungan kedua variabel tidak ada;
b). Hubungan kedua variabel lemah;
c). hubungan kedua variabel cukup kuat;
d). Hubungan kedua variabel kuat; dan
e). Hubungan kedua variabel sangat kuat;
Penentuan tersebut didasarkan pada kreteria yang menyebutkan jika
hubungan mendekati 1, maka hubungan semakin kuat, sebaliknya jika hubungan
mendekati nol (0), maka hubungan semakin lemah. Adapun Asumsi-asumsi dasar
korelasi diantaranya ialah:
·
Kedua
variabel bersifat independen satu dengan yang lainnya, artinya masing-masing
variabel berdiri sendiri dan tidak tergantung satu dengan yang lainnya.
·
Tidak
ada istilah variabel bebas dan variabel tegantung.
·
Data
untuk kedua variabel berdistribusi normal, artinya data yang distribusinya
simestris sempurna. Jika digunakan Bahasa umum disebut berbentk kurva bel.
1.4 KARAKTERISTIK KORELASI
Beberapa karakteristik-karakteristik korelasi diantaranya:
1.
Kisaran
Korelasi: Kisaran (range) korelasi mulai dari nol (0) sampai satu (1),
korelasi bisa pisitif dan bisa juga negatif.
2.
Korelasi
Sama Dengan Nol: Korelasi sama dengan 0 mempunyai arti tidak ada hubungan antra
dua variabel.
3.
Korelasi
Sama Dengan Satu: Korelasi sam dengan +1, artinya kedua variabel mempunyai
hubungan linier sempurna (membentuk garis lurus) positif. Korelasi seperti ini
mempunyai makna jika nilai X naik, maka nilai Y juga naik.
4.
Korelasi
Sama Dengan Minus Satu: artinya kedua variabel mempunyai hubungan linier
sempurna (membentuk garus lurus) negatif. Korelasi sempurna seperti ini
mempunyai makna jika nilai X turun, maka nulai Y juga turun dan berlaku
sebaliknya.
1.5
MACAM-MACAM
KORELASI
1)
Korelasi
Poduct Moment (Pearson)
Korelasi Pearson Product Moment, yang merupakan pengukuran
parametik, akan menghasilkan koefesien korelasi yang berfungsi untuk mengukur kekuatan
hubungan linier antara dua variabel. Jika hubungan dua variabel tidak linier,
maka koefesien krelasi pearson tersebut tidak mencerminkan kekuatan hubungan
dua variabel yang sedang diteliti, meski kedua variabel mempunyai hubungan
kuat. Simbol untuk korelasi Pearson adalah “p” jika diukur dalam
populasi, dan “r” jika di ukur dalam sampel. Korelasi Pearson mempunyai jarak
-1 sampai dengan +1. Jika koefisien korelasi adalah -1, maka kedua variabel
yang diteliti mempunyai hubungan linier sempurna negatif. Jika koefisien
korelasi adalah +1, maka kedua variabel yang diteliti mempunyai hubungan
sempurna positif. Jika koefisien korelasi menunjukkan angka 0, maka tidak tidak
terdapat hubungan antara dua variable yang dikaji. Jika hubungan dua variable
linier sempurna, maka sebaran data tersebut akan membentuk garis lurus.
Sekalipun demikian pada kenyataannya kita akan sulit menemukan data yang dapat
mementuk garis linier sempurna.
Ø Syarat-syarat data yang digunakan dalam Korelasi Pearson, diantaranya:
o Bersekala interval/ rasio
o Variabel X dan Y harus bersifat independen satu dengan lainnya
o Variabel harus kuatitaif simetris
Ø Asumsi dalam Korelasi Pearson diantaranya ialah:
o Terdapat hubungan linier antara X dan Y
o Data yang berdistribusi normal
o Variabel X dan Y simetris, artinya variabel X tidak berfungsi
sebagai variabel bebas dan Y sebagai variable tergantung
o Sampling representative
o Varian kedua variabel sama
Ø Prosedur Korelasi Pearson
o Siapkan data
o Membuat desain variabelnya
o Memasukkan dati dari urutan pertama sampai akhir
o Melakukan prosedur analisis
o Membuat inter pretasi
o Kesimpulan
2)
Korelasi
Spearman
Korelasi Spearman merupakan korelasi non-parametik. Koefisien
korelasi ini mempunyai symbol r (rho). Pengukuran dengan menggunakan korelasi Spearman
digunakan untuk menilai adanya seberapa baik fungsi monotik (suatu fungsi yang
sesuai perintah) arbiter digunakan untuk menggambarkan hubungan dua variabel
dengan tanpa membuat asumsi distribusi frekuensi dari variabel-variabel yang
diteliti. Nilai koefisien korelasi dan kreteria penilaian kekuatan hubungan dua
variabel sama dengan yang digunakan dalam korelasi Pearson. Penghitungan
dilakukan dengan cara yang sama dengan korelasi Pearson, perbedaan terletak
pada hubungan data kedalam bentuk rangking sebelum dihitung koefisien
korelasinya. Itulah sebabnya korelasi ini disebut sebagai Korelasi Rank
Spearman.
Ø Syarat-sayarat dan Asumsi Penggunaan Korelasi Rank Spearman
Data yang digunakan harus bersekala ordinal. Berbeda denga Korelasi
Pearson, Korelasi Spearman tidak memerlukan adanya hubungan linier dalam
variabel-variabel yang diukur dan tidak perlu menggunakan data yang bersifat
interval, tapi cukup dengan menggunakan data ordinal. Asumsi yang digunakan
dalam korelasi ini adalah tingkatan (rank) berikutnya harus menunjukkan posisi
jarak yang sama pada variabel-variabel yang di ukur. Jika menggunakan skala
Likert, maka jarak skala yang digunakan harus sama. Juga, data tidak harus
berdistribusi normal.
Ø Prosedur Korelasi Spearman
o Siapkan data
o Membuat desain variabelnya
o Memasukkan data
o Melakukan prosedur analisis
o Mengenterpretasi hasil
o Kesimpulan
3)
Korelasi
Kendall’s Tau
Korelasi Kendall’s Tau digunakan untuk mengukur kekuatan hubungan
dua variabel. Korelasi ini sama dengan Korelasi Spearman yang dikategorokan
sebagai statistic non-parametik. Data yang digunakan bersekala ordinal dan
tidak harus berdistribusi normal.
Ø Prosedur Korelasi Kendall’s Tau
o Siapkan data
o Membuat desain variabelnya
o Masukkan data
o Melakukan analisis
o Membuat interpretasi
o Kesimpulan
4)
Korelasi
Parsial
Korelasi Parsial merupakan korelasi antara dua variabel ketika
pengaruh dari satu atau lebih variabel yang berhubungan yang berperan sebagai
variabel ketiga dikendalikan atau diparsialkan. Tujuannya ialah untuk
memperoleh varian unik dalam hubungan antare kedua variabel yang dikorelasikan
dan menghilangkan varian variabel ketiga yang dapat berpengaruh terhadap
hubungan kedua variabel tersebut. vasiavel yang diteliti harus kontinus dan
bersekala interval. Hubungan antar bvariabel bersifat linier dan data harus
berdistribusi normal. Korelasi parsal hanya digunakan jika variabel ketiga
mempunyai keterkaitan dengan salah satu variabel yang kita korelasikan.
Ø Prosedur Korelasi Parsial
o Siapkan data
o Membuat desain variabelnya
o Memasukkan data
o Melakukan analisis
o Membuat interpretasi
5)
Korelasi
Point Biserial
Korelasi ini digunakan untuk menganalisis hubungan antara data
interval/rasio dengan data dikotomi (murni).
6)
Korelasi
Biserial
Korelasi ini digunakan untuk menganalisis hubungan data
interval/rasio dengan data dikotomi (buatan).
7)
Korelasi
Phi (Koefesien Phi)
Korelasi ini digubakan untuk analisis hubungan antara data nominal
dikotomi dangan data dikotomi.
8)
Korelasi
Koefesien Kontegensi
Korelasi ini digunakan untuk menganalisis hubungan antara data
nominal (politomi) dengan data nominal (politomi).
9)
Korelasi
Ganda
Korelasi ganda (multiple correlation) adalah korlasi antara
dua atau lebih variabel bebas (independent) secara bersama-sama dengan
satu variabel terikat (dependent). Angka yang menunjukkan arah dan besar
kuatnya hubungan antara dua atau lebih variabel bebas dengan satu variabel
tarikat disebut koefesien korelasi ganda dan di simbolkan R.
10)
Koefisien
Determinasi
Koefisien determinasi dilambangan dengan r2. Nilai
ini menyatakan proporsi variasi keseluruhan dalam nilai variabel dependent
yang dapat diterangkan atau diakibatkan oleh hubungan linier dengan variabel independent,
selain itu (sisanya) diterngakan oleh variabel yang lain (galat atau
peubahan lainnya). Nilai koefisien determinasi dinyatakan dalam kuadrat dari
nilai koefesien korelasi r2 x 100%= n%, memiliki makna bahwa
nilai variabel dependent dapat diterangkan oleh variabel independent sebesar
n%, sedangkan sisanya sebesar (100-n) % diterangkan oleh gelat (error)
atau pengaruh variabel yang lain. Sedangkan untuk analisis korelasi dengan
jumlah variabel dependent lebih dari satu (ganda/majemuk), terdapat
koefisien determinasi penyesuaian (adjustment) yang sangat sensitive
dengan jumlah variabel. Biasanya untuk analisis korelasi majemuk/ganda yang
sering dipakai adalah koefisien dterminasi penyesuaian (koefisien determinasi
sederhana tidak memperhatikan jumlah variabel independent). Rumus yang
dipakai adalah:
KD = r2 x 100%
KD = Koefisien
Determinasi
r = Koefisien
Korelasi
2.1 REGRESI
Istilah regresi pertama kali dalam konsep statistik digunakan oleh
Sir Francis Galton dimana yang bersangkutan melakukan kajian yang menunjukkan
bahwa tinggi badan anak-anak yang dilahirkan dari para orang tua yang tinggi
cenderung bergerak (regress) kearah ketinggian rata-rata populasi secara
keseluruhan. Galton memperkenalkan kata regresi (regression) sebagai nama
proses umum untuk memprediksi satu variabel, yaitu tinggi badan anak dengan
menggunakan variabel lain, yaitu tinggi badan orang tua. Pada perkembangan
berikutnya hukum Galton mengenai regresi ini ditegaskan lagi oleh Karl Pearson
dengan menggunakan data lebih dari seribu. Pada perkembangan berikutnya, para
ahli statistik menambahkan isitilah regresi berganda (multiple regression)
untuk menggambarkan proses dimana beberapa variabel digunakan untuk memprediksi
satu variabel lainnya.
Regresi dalam pengertian moderen menurut Gujarati (2009) ialah
sebagai kajian terhadap ketergantungan satu variabel, yaitu variabel tergantung
terhadap satu atau lebih variabel lainnya atau yang disebut sebagai variabel –
variabel eksplanatori dengan tujuan untuk membuat estimasi dan / atau
memprediksi rata – rata populasi atau nilai rata-rata variabel tergantung dalam
kaitannya dengan nilai – nilai yang sudah diketahui dari variabel
ekslanatorinya. Selanjutnya menurut Gujarati meski analisis regresi berkaitan
dengan ketergantungan atau dependensi satu variabel terhadap variabel –
variabel lainnya hal tersebut tidak harus menyiratkan sebab – akibat
(causation). Dalam mendukung pendapatnya ini, Gujarati mengutip pendapat Kendal
dan Stuart yang diambil dari buku mereka yang berjudul “The Advanced
Statistics” yang terbit pada tahun 1961 yang mengatakan bahwa,” suatu hubungan
statistik betapapun kuat dan sugestifnya tidak akan pernah dapat menetapkan
hubungan sebab akibat (causal connection); sedang gagasan mengenai sebab akibat
harus datang dari luar statistik, yaitu dapat berasal dari teori atau lainnya”.
Sedang menurut Levin & Rubin (1998:648), regresi digunakan
untuk menentukan sifat – sifat dan kekuatan hubungan antara dua variabel serta
memprediksi nilai dari suatu variabel yang belum diketahui dengan didasarkan
pada observasi masa lalu terhadap variabel tersebut dan variabel-variabel
lainnya. Selanjutnya dalam regresi kita akan mengembangkan persamaan estimasi
(estimating equation), yaitu rumus matematika yang menghubungkan
variabel-variabel yang diketahui dengan variabel-variabel yang tidak diketahui.
Setelah dipelajari pola hubungannya, kemudian kita dapat mengaplikasikan
analisis korelasi (correlation analysis) untuk menentukan tingkatan dimana
variabel – variabel tersebut berhubungan. Kesimpulannya, analisis korelasi
mengungkapkan seberapa benar persamaan estimasi sebenarnya menggambarkan
hubungan tersebut. Lebih lanjut Levin & Rubin mengatakan bahwa: “ Kita
sering menemukan hubungan sebab akibat antar variabel – variabel; yaitu
variabel bebas ‘menyebabkan’ variabel tergantung berubah. Sekalipun demikian
mereka melanjutkan bahwa: “penting untuk kita perhatikan bahwa yang kita anggap
hubungan (relationship) yang diketemukan melalui regresi sebagai hubungan
asosiasi (relationship of association) tetapi tidak selalu harus sebab dan
akibat (cause and effect). Kecuali kita mempunyai alasan – alasan khusus untuk
percaya bahwa (perubahan pada) nilai – nilai variabel tergantung disebabkan
oleh nilai –2
nilai variabel (variabel) bebas; jangan menyimpulkan (infer)
hubungan sebab akibat dari hubungan yang diketemukan dalam regresi.
Karena Levin & Rubin dalam mendefinisikan regresi juga
menggunakan istilah “analisis korelasi”, maka sebaiknya dalam bagian ini
penulis perlu menjelaskan perbedaan antara regresi dan korelasi. Menurut
Gujarati (2009: 20) analisis korelasi bertujuan untuk mengukur kekuatan
(strength) atau tingkatan (degree) hubungan linier (linear association) antara
dua variabel. Untuk mengukur kekuatan hubungan linier ini digunakan koefesien
korelasi. Sebaliknya dalam regresi kita tidak melakukan pengukuran seperti itu.
Dalam regresi kita membuat estimasi atau memprediksi nilai rata-rata satu
variabel didasarkan pada nilai – nilai tetap variabel – variabel lain.
Perbedaan yang mendasar antara regresi dan korelasi ialah dalam regresi
terdapat (hubungan) asimetri dalam kaitannya dengan perlakuan terhadap variabel
tergantung dan variabel bebas. Variabel tergantung diasumsikan statistitikal,
acak atau stokhastik, yaitu mempunyai distribusi probabilitas. Sedang variabel
bebas / prediktornya diasumsikan mempunyai nilai – nilai tetap. Sebaliknya
dalam korelasi kita memperlakukan dua variabel atau variabel – variabel apa
saja secara simetris, yaitu tidak ada perbedaan antara variabel bebas dan
variabel tergantung. Sebagai contoh korelasi antara nilai ujian matematik dan
statistik sama dengan korelasi nilai ujian statistik dan matematik. Lebih
lanjut dalam korelasi kedua variabel diasumsikan random.
Regresi linier mempunyai persamaan yang disebut sebagai persamaan
regresi. Persamaan regresi mengekspresikan hubungan linier antara variabel
tergantung / variabel kriteria yang diberi simbol Y dan salah satu atau lebih
variabel bebas / prediktor yang diberi simbol X jika hanya ada satu prediktor
dan X1, X2 sampai dengan Xk, jika terdapat lebih dari satu prediktor (Crammer
& Howitt, 2006:139). Persamaan regresi akan terlihat seperti di bawah ini:
·
Untuk
persamaan regresi dimana Y merupakan nilai yang diprediksi, maka persamaannya
ialah:
Y = a + β1X1 (untuk regresi linier sederhana)
Y = a + β1X1 + β2X2 + … + βkXk (untuk regresi linier berganda)
·
Untuk
persamaan regresi dimana Y merupakan nilai sebenarnya (observasi), maka
persamaan menyertakan kesalahan (error term / residual) akan menjadi:
Y = a + β1X1 + e (untuk regresi linier sederhana)
Y = a + β1X1 + β2X2 + … + βkXk + e (untuk regresi linier berganda)
Dimana:
·
X :
merupakan nilai sebenarnya suatu kasus (data)
·
β :
merupakan koefisien regresi jika hanya ada satu prediktor dan koefisien regresi
parsial jika terdapat lebih dari satu prediktor. Nilai ini juga mewakili
mewakili koefesien regresi baku (standardized) dan koefisien regresi tidak baku
(unstandardized). Koefesien regresi ini merupakan jumlah perubahan yang terjadi
pada Y yang disebabkan oleh perubahan nilai X. Untuk menghitung perubahan ini
dapat dilakukan dengan cara mengkalikan nilai prediktor sebenarnya (observasi)
untuk kasus (data) tertentu dengan koefisien regresi prediktor tersebut.
·
a :
merupakan intercept yang merupakan nilai Y saat nilai prediktor sebesar nol.
Sedang garis regresi didefinisikan sebagai garis lurus yang ditarik
dari titik – titik diagram pencar (scattered diagram) dari nilai
variabel tergantung dan variabel bebas sehingga garis tersebut menggambarkan
hubungan linier antara variabel-variabel tersebut. Jika nilai-nilai ini
merupakan garis regresi nilai baku maka garis ini sama dengan garis korelasi.
Garis ini disebut juga sebagai garis kecocokan yang sempurna dimana garis lurus
tersebut berada pada posisi terdekat pada titik-titik diagram pencar. Garis ini
dapat digambarkan dari nilai-nilai persamaan regresi dalam bentuk yang paling
sederhana yaitu:
Nilai yang diprediksi = intercept + (koefisien regresi x nilai
prediktor)
Sumbu vertikal dari diagram pencar digunakan untuk menggambarkan
nilai-nilai variabel tergantung sedang sumbu horizontal menggambarkan nilai
prediktor. Intercept merupakan titik sumbu vertikal yang merupakan nilai
variabel tergantung yang diprediksi saat nilai prediktor atau variabel bebas
sebesar nol. Nilai yang diprediksi akan sebesar akan sebesar 0 jika koefisien
regresi baku digunakan. Itulah sebabnya saat menggunakan IBM SPSS keluaran yang
digunakan dalam koefisien regresi menggunakan keluaran pada kolom “unstandardized
coefficient”.
Jika digambarkan akan nampak seperti di bawah ini:
Gambar 1.1 Garis Regresi
Persamaannya ialah:
Y = a + β1X1
Dengan:
Y= variabel tergantung / variabel
kriteria
a= intercept Y
β = kemiringan (slope)
X= variabel bebas
Garis regresi mempunyai 3 (tiga) kemungkinan yaitu:
1) hubungan linier positif,
2) hubungan linier negatif, dan
3) tidak ada hubungan linier.
Gambarnya seperti di bawah ini:
1) Hubungan Linier Positif
Gambar 1.2
Hubungan Linier Positif
2) Hubungan Linier Negatif
Gambar 1.3 Hubungan Linier Negatif
3) Tidak ada Hubungan Linier
Gambar 1.4
Tidak Ada Hubungan Linier
Ø Istilah-istilah yang mewakili pengertian variabel bebas dan
variabel tergantung dalam regresi. Gujarati memberikan istilah sebagai berikut:
·
Variabel tergantung (dependent variable):
disebut juga sebagai variabel yang dijelaskan (explained variable) /
variabel yang diprediksi (predictand) / regresan (regressand) /
variabel yang merespon ( response) / endegenous / keluaran (outcome)
/ variabel yang dikontrol (controlled variable).
·
Variabel yang menerangkan (explanatory
variable): disebut juga sebagai variabel tergantung (dependent variable)
/ variabel yang memprediksi (predictor) / regresor (regressor) /
variabel stimulus ( stimulus) / exogenous / kovariat (covariate)
/ variabel kontrol (control variable).
2.2 Tujuan
Tujuan menggunakan analisis regresi ialah:
·
Membuat estimasi rata-rata dan nilai variabel
tergantung dengan didasarkan pada nilai variabel bebas.
·
Menguji hipotesis karakteristik dependensi
·
Untuk meramalkan nilai rata-rata variabel bebas
dengan didasarkan pada nilai variabel bebas diluar jangkauan sampel
2.3 Asumsi
Penggunaan Regresi
Penggunaan regresi linier sederhana didasarkan
pada asumsi diantaranya sbb:
·
Model regresi harus linier dalam parameter
·
Variabel bebas tidak berkorelasi dengan disturbance
term (Error) .
·
Nilai disturbance term sebesar 0 atau
dengan simbol sebagai berikut: (E (U / X) = 0
·
Varian untuk masing-masing error term (kesalahan)
konstan
·
Tidak terjadi otokorelasi
·
Model regresi dispesifikasi secara benar. Tidak
terdapat bias spesifikasi dalam model yang digunakan dalam analisis empiris.
·
Jika variabel bebas lebih dari satu, maka
antara variabel bebas (explanatory) tidak ada hubungan linier yang nyata
2.4
Syarat-syarat Regresi
Model kelayakan regresi Linier dalam IBM SPSS didasarkan pada
hal-hal sebagai berikut:
a.
Model
Regeresi dikatakan layak jika angka signofikasi pada ANOVA sebesar <0.05
b.
Predictor
yang digunakan sebagai variabel bebas harus layak. Kelayakan ini diketahui jika
angka Standart error of estimasi < Standart Deviation.
c.
Koefesien
regresiharus signifikan. Pengujian dialakukan dengan uji t. koefesien regresi
signifikan jika t hitung > t table (nilai kritis). Dalam IBM SPSS dapat
diganti dengan menggunakan nilai signifikansi (sig) dengan ketentuan sebagai
berikut:
o Jika sig > 0.05; koefesien regresi tidak signifikan.
o Jika sig < 0.05; koefesien regresi signifikan.
d.
Tidak
boleh terjadi multikolinieritas, artinya tidak boleh terjadi korelasi antar
variabel bebas yang sangat tinggi atau terlalu rendah. Syarat ini hanya berlaku
untuk regresi linier berganda dengan variabel bebas lebih dari satu. Terjadi
multikolinieritas jika koefesien korelasi antara variable bebas > 0,7 atau
< - 7.
e.
Tidak
terjadi otokorelasi jika: - 2 ≤ DW ≤ 2.
f.
Keselerasan
model regresi dapat diterangkan dengan menggunakan nilai r2 semakin besar nilai
tersebut maka model semakin baik. Jika nilai mendekati 1 maka model regresi
semakin baik. Nilai r2 mempunyai karakteristik diantaranya: 1) selalu positif,
2) Nilai r2 maksimal sebesar 1. Jika Nilai r2 sebesar 1 akan mempunyai arti
kesesuaian yang sempurna. Maksudnya seluruh variasi dalam variabel tergantung
(variabel Y) dapat diterangkan oleh model regresi. Sebaliknya jika r2 sama
dengan 0, maka tidak ada hubungan linier antara variabel bebas (variabel X) dan
variabel tergantung (variabel Y).
g.
Terdapat
hubungan linier antara variabel bebas (X) dan variabel tergantung (Y).
h.
Data
harus berdistribusi normal
i.
Data
berskalainterval atau rasio
j.
Terdapat
hubungan dependensi, artinya satu variabel merupakan variabel tergantung yang
tergantung pada variabel-variabel lainnya.
2.5 Konsep
Linieritas Dalam Regresi
Ada dua macam linieritas dalam analisis regresi, yaitu linieritas
dalam variabel dan linieritas dalam parameter. Yang pertama, linier dalam
variabel merupakan nilai rata-rata kondisional variabel tergantung yang
merupakan fungsi linier dari variabel (variabel) bebas. Sedang yang kedua,
linier dalam parameter merupakan fungsi linier parameter dan dapat tidak linier
dalam variabel.
Setiap analisis regresi pasti ada korelasinya, tetapi analisis
korelasi belum tentu dilanjutkan dengan analisis regresi. Analisis korelasi
yang dilanjutkan dengan analisis regresi yaitu apabila korelasi mempunyai
hubungan kausal (sebab-akibat) atau hubungan fungsional. Untuk menetapkan dua
variabel mem[unyai hubungan kausal atau tidak, harus didasarkan pada teori atau
konsep-konsep tentang dua variabel tersebut. Analisis regresi digunakan untuk
mengetahui bagaimana pola variabel dependent (kriteria) dapat
dipredeksikan melalui variabel independent (prediktor)[3].
Regresi yang berarti peramalan, penaksiran, atau pendugaan pertamakali
diperkenalkan pada tahun 1877 oleh Sir Francis Galton (1822-1911) sehubungan
dengan penelitiannya tentang tinggi manusia. Penelitian tersebut membandingkan
tinggi badan anak laki-laki dengan tinggi badan ayahnya.
2.6 Macam-macam
Regresi
1. Regresi Linier Sederhana
Yaitu regresi linier dengan variabel prediktor (bebas). Regresi
Linear Sederhana adalah Metode Statistik yang berfungsi untuk menguji sejauh
mana hubungan sebab akibat antara Variabel Faktor Penyebab (X) terhadap
Variabel Akibatnya. Faktor Penyebab pada umumnya dilambangkan dengan X atau
disebut juga dengan Predictor sedangkan Variabel Akibat dilambangkan dengan Y
atau disebut juga dengan Response. Regresi Linear Sederhana atau sering disingkat
dengan SLR (Simple Linear Regression) juga merupakan salah satu Metode
Statistik yang dipergunakan dalam produksi untuk melakukan peramalan ataupun
prediksi tentang karakteristik kualitas maupun Kuantitas.
Bentuk persamaan:
Ŷ = a + bx
Ŷ = a + bx
Ŷ = bariabel dependent/kreteria (yang diprediksikan)
a = konstanta (harga Y untuk X = 0)
b = angka arah (koefisien regresi) ; bila b positif (+), arah regresi naik dan bila b negative (-), arah regresi turun.
x = variabel independent (predictor)
a = konstanta (harga Y untuk X = 0)
b = angka arah (koefisien regresi) ; bila b positif (+), arah regresi naik dan bila b negative (-), arah regresi turun.
x = variabel independent (predictor)
Persamaan garis regresi linier sederhanaya dapat dinyatankan dalam
bentuk, rata-rata Y bagi X tertentu. Konstanta atau parameter atau koefisien
regresi populasi. Karena populasi jarang diamati secara langsung, maka
digunakan persamaan regresi linier sederhana sampel sebagai penduga persamaan
regresi linier sederhana populasi.
Persamaan memberikan arti jika variabel X mengeluarkan satu satuan,
maka variabel Y akan mengalami peningkatan atau penurunan sebesar 1b b. untuk
membuat peramalan, penaksiran atau pendugaan dengan persamaan regresi, maka
nilai a dan b harus ditentukan terlebih dahulu. Dengan metode uadrat terkeci (least
square), nilai a dan b dengan rumus diatas.
2. Regresi Linier Berganda
Jika dalam regeresi linier sederhana
hanya da satu perubahan bebas (X) yang dihubungkan dengan perubahan tidak bebas
(Y) sedangkan dalam regresi linier berganda ada beberapa variabel bebas (X1),
(X2), (X1) dan (Xn) yang merupakan bagian dari
analisis multivariant dengan tujuan untuk menduga besarnya koefisien regresi
yang akan menunjukkan besarnya pengaruh beberapa variabel bebas independent terhadap
variabel tidak bebas dependent. Dalam uji regresi berganda seluruh
variabel predictor (bebas) dimasukkan ke dalam regresi secara serentak. Jadi,
peneliti bisa menciptakan persamaan regresi guna memprediksi variabel terikat
dengan memasukkan, secara serentak variabel bebas. Persamaan regresi kemudian
menghasilkan konstanta dan koifisien regresi bagi masing-masing variabel bebas[4].
C.
KESIMPULAN
Korelasi merupakan hubungan antara dua kejadian dimana kejadian
yang satu dapat mempengaruhi eksistensi kejadian yang lain, misalnya kejadian X
mempengaruhi kejadian Y. apabila dua variabel X dan Y mempunyai hubungan, maka
nilai variabel X yang sudah diketahui dapat dipergunakan untuk
memperkirakan/menaksir atau meramalkan Y. ramalan pada dasarnya merupakan perkiraan/taksiran mengenai suatu kejadian
(nilai suatu variabel) untuk suatu kejadian yang akan datang. Variabel yang
nilanya akan di ramalkan disebut variabel tidak bebas (dependent variable), sedangkan
variabel C yang nilainya akan dipergunakan untuk meramalkan untuk meramalkan
nilai variabel Y disebut variabel bebas (independent variable), atau
variabel peramal (predictor) atau seringkali disebut variabel yang
menerangkan (explanatory).
Jadi analisis korelasi ini memungkinkan kita untuk mengetahui suatu
di luar hasil penyelidikan, salah satu cara untuk melakukan peramalan dengan
menggunakan garis regresi. Untuk menghitung parameter yang akan dijadikan dalam
penentuan antara hubungan dua variabel, dengan beberapa cara yaitu: koefisien
detremninasi, koefisien korelasi. Apabila terdapat data berkelompok menggunakan
koefisien data berkelompok dan bila menggunakan data bergandamaksudnya variabel
bebas yang mempengaruhi variabel terikat ada dua, maka menggunakan koefisien
berganda.
DAFTAR PUSTAKA
Dr. Supardi U.S. MM., Mpd. 2013. Aplikasi Statatistika Dalam Penelitian
‘’Konsep Statistika Yang Lebih Komprehensif’’. Adikita, Jakarta
selatan, Indonesia.
Drs. Mardalis. 1993. Metode Penelitian ‘’Suatu Pendekatan
Proposal’’. Ed. 1, Cet. 2, Bumi Aksara, Jakarta, Indonesia.
Dajan, Anto. 1996. Pengantar Metode Statistik Jilid II. PT
Pustaka LP3ES Indonesia, Jakarta.
Jonathan Sarwono, Korelasi dan Regresi Linier. Pdf
Sudjana. 2005. metode Statistika. Bandung: Tarsito