Belajar Bareng: 05/01/14

STATISTIK KORELASI DAN REGRESI

BAB I

PENDAHULUAN

A. LATAR BELAKANG

Analisis statistika bertjuan untuk mengetahui apakah ada hubungan antara dua tau lebih variabel. Hubungan demikian ini dapat dinyatakan dalam bentuk rumus matematik, maka kita akan dapat menggunakannya untuk keperluan peramalan.

Masalah peramalan dapat di lakukan dengan menerapkan persamaan regresi, mendekati nilai tengah populasi. Istilah regresi di tetapkan pada semua peramalan, dan tidak harus berimplikasi suatu regresi mendekati nilai tengahpopulasi. Sedangkan teknik korelasi merupakan teknikk analisis yang melihat kecenderungan pola dam variabel berdasarkan kecenderungan pola dalam variabel yang lain apakah naik atau turun atau tidak menentu, jika kecenderungan dalam satu variabel selalu di ikuti variabel lain, kita dapat mengatakan bahwa kedua variabel ini mempunyai hubungan atau korelasi.

BAB II

B. PEMBAHASAN

1.1 PENGERTIAN STATISTIK ATAU STATISTIKA

Secara etimologis kata statistika berasal dari kata status (Bahasa latin) atau kata staat (bahasa belanda); dalam Bahasa Indonesia kata tersebut diterjemahkan menjadi Negara.

Dalam kamus Bahasa Indonesia, statistika diartikan dalam dua arti: pertama, Statistika sebagai “ilmu statistika”, dan kedua, statistika diartikan sebagai “ukuran yang diperoleh atau berasal dari sampel,” yaitu sebagai lawan dari kata “parameter” yang berarti ukuran yang diperoleh atau berasal dari populasi. Dalam hal pengertian sebagai ukuran yang diperoleh dari sampel sering disebut dengan istilah statistik.

Statistik, diartikan sebagai kumpulan fakta yang berbentuk angka-angka yang disusun dalam bentuk daftar atau tabel yang menggambarkan suatu persoalan. Kata statistik dipakai untuk menyatakan kumpulan data bilangan, maupun bilangan yang disusun dalam tabel atau diagram yang melukiskan atau menggambarkan suatu persoalan. Statistika sebagai “pengetahuan yang berhubungan dengan cara-cara mengumpulkan data, pengolahan atau penganalisisannya dan penarikan kesimpulan berdasarkan kumpulan data dan penganalisisan yang telah dilakukan”[1].

Statistika dapat diartikan sebagai ilmu pengetahuan yang mempelajari tentang bagaimana cara kita mengumpulkan, mengolah, menganalisis, dan menginterpretasiakan data sehingga dapat disajikan dengan lebih baik dan dapat ditarik kesimpulan.

Statistika juga dapat diartikan seperangkat metode yang membahas tentang:

1) Bagaimana cara mengumpulkan data yang dapat memberikan informasi yang optimal,

2) Bagaimana cara meringkas, mengolah, dan menyajikan data,

3) Bagaimana cara melakukan analisis terhadap sekumpulan data, sehingga dari analisis itu timbul strategi-strategi tertentu,

4) Bagaimana cara mengambil kesimpulan dan menyarankan keputusan yang sebaiknya diambil, atas dasar strategi yang ada,

5) Bagaimana menentukan besarnya resiko kekeliruan yang mungkin terjadi jika mengambil keputusan atasdasar strategi tersebut.

a. Klarifikasi Statistika

Ø Pembagian Statistika Berdasarkan Cara Pengolahan Data

1. Statistika Deskriptif

Statistika deskriptif atau statistika deduktif, merupakan statistika yang mempelajari cara pengumpulan data dan penyajian data sehinga mudah dipahami. Statistika deskriptif hanya berhubungan dengan hal menguraikan atau memberikan keterangan-keterangan mengenai suatu data atau fenomena. Dengan kata lain hanya berfungsi menerangkan keadaan, gejala atau persoalan.

Penarikan kesimpulan pada statistika deskriptif (jika ada) hanya di tunjukkan pada kumpulan data yang ada. Didasarkan atas ruang lingkup bahasannya.

2. Statistika Infensial

Statistika infensial disebut pula statistika induktif adalah statistika yang mempelajari mengenai penafsiran dan penarikan kesimpulan yang berlaku secara umum dari data sampel yang tersedia. Statistika infensial berhubungan dengan pendugaan populasi dan pengujian hipotesis dari suatu data atau keadaan atau fenomena. Dengan kata lain, statistika infensial berfungsi meramalkan dan mengotrol keadaan atau kejadian.

Penarikan kesimpulan pada statistika infensial ini merupakan generalisasi dari suatu populasi berdasarkan data (sampel) yang ada. Statistika intensial biasanya digunakan untuk membuat generalisasi dari kaitan anatara 2 (dua) atau lebih fenomena atau variabel. Secara garis besar, kaitan antara 2 (dua) atau lebih venomina atau variabel dapat di bedakan atas dua (2) bentuk kaitan, kaitan yaitu asosiasi (hubungan) dan komparasi (perbandingan).

Sedangkan di tinjau dari teknik uji statistika yang dapat digunakan, statistic inferensial dibedakan atas: statistika parametik dan statistika non-parametik. Statistik parametik merupakan teknik uji statistika yang merupakan parameter variabel/objek secara langsung. Sedangkaaan statistika non-parametik merupakan teknik uji statistika yang dilakukan terhadap sisi lain dari parameter suatu variabel/objek yang akan dikaji.

Ø Pembagian Statistik Berdasarkan Ruang lingkup penggunaannya

1) Statistika pendidikan

Yaitu statistika yang digunakan atau diterapkan pada bidang atau disiplin ilmu pendidikan.

2) Statistika Sosial

Yaitu statistika yang digunakan atau diterapkan pada bidang atau disiplin ilmu sosial.

3) Statistika Kesehatan

Yaitu statistika yang digunakan atau diterapkan pada bidang atau disiplin ilmu kesehatan.

4) Satatistika Ekonomi

Yaitu statistika yang digunakan atau diterapkan pada bidang atau disiplin ilmu ekonomi.

5) Statistika Pertanian

Yaitu statistika yang digunakan atau diterapkan pada bidang atau disiplin ilmu pertanian.

6) Statistika bidang lainnya.

Ø Karakteristik Statistika

- Statistika selalu bekerja dengan angka atau bilangan yang disebut dengan data kuantatif. Hal ini dimaksudkan apabila statistika dipergunakan sebagai alat analisis bagi data kualitatif (bahan/bilangan yang tidak berwujud angka atau bilangan), maka data kualitatif tersebut harus diubah atau dikonversikan terlebih dahulu menjadi data kuantitatif, (data ini disebut kuantitatifkan.

- Statistika bersifat obyektif

Kesimpulan dan ramalan yang dihasilkan oleh statistika didasarkan pada angka yang diolah (obyektif) dan tidak didasarkan pengaruh dari luar (subyektif).

- Statistika Bersifat universal

Ruang lingkup ststistika tidaklah sempit, ruanglingkupnya sangat luas bagi kehidupan manusia baik dibidang perdagangan, pertanian, kependudukan, pendidikan, dan sebagainya.

Ø Peranan, Fungsi dan Kegunaan Statistika

a. Peranan Statistika

Pada era globalisasi, hamper semua bidang tidak terlepas dengan menggunakan angka, data dan fakta. Hal ini menunjukkan bahwa statistika sangat dibutuhkan. Ststistika sebagai sarana mengembangkan cara berpikir logis, lebih dari itu statsitika mengembangkan berpikir secara ilmiah untuk merencanakan (forcasting) penyelidikan, menyimpulkan dan membuat keputusan yang teliti dan meyakinkan. Baik disadari atau tidak, statistika merupakan bagian substansi dari latihan professional dan menjadi landasan dari kegiatan-kegiatan penelitian. Peranan statistika dalam berbagai kegiatan manusia antara lain, dalam aktivitas kehidupan sehari-hari, dalam ilmu pengetahuan dan dalam aktivitas penelitian ilmiah.

b. Fungsi Statistika

Satatistika membantu seseorang untuk mengumpulkan, mengolah, menganalisa, dan menyimpulkan hasil yang telah dicapai dalam kegiatan tertentu. Dalam hal ini statistika sebagai alat bantu. Sedangkan menurut Hasan (2008) statistika berfungsi sebagai:

1) Bank data, yaitu menyediakan data untuk diolah dan diinterpresentasikan agar dapat dipakai untuk menerangkan keadaan yang perlu diketahui atau diungkap.

2) Alat quality control, yaitu sebagai alat pembantu standarisasi dan sekaligus sebagai alat pengawas.

3) Pemecahan masalah dan pembuatan keputusan sebagai dasar penetapan kebijakan dan langkah lain untuk lebih lanjut mempertahankan dan mengembangkan suatu lembaga dalam pemberian pelayanan dan sebagainya.

c. Kegunaan Statistika

Banyak manfaat dan kegunaan statistika diantaranya:[2]

1) Memperoleh gambaran, baik gambaran secara umum maupun secara khusus tentang suatu gejala, peristiwa/ atau obyek.

2) Mengikuti perkembangan/ pasang surut mengenai gejala, keadaan atau peristiwa dari waktu ke waktu.

3) Melakukan pengujian, apakah gejala yang satu berbeda dengan gejala yang lainnya ataukah tidak; jika terdapat perbedaan apakah perbedaan itu merupakan perbedaan yang berarti (meyakinkan) ataukah perbedaan itu terjadi hanya karena kebetulan.

4) Mengetahui apakah gejala yang satu ada hubungan dengan gejala yang lainnya.

5) Menyusun laporan yang berupa data kuantitatif dengan teratur, ringkas dan jelas.

6) Menarik kesimpulan secara logis, mengambil keputusan secara tepat dan mantap, serta dapat diperkirakan atau meramalkan hal-hal yang mungkin terjadi dimasa mendatang.

1.2 MENGENAL KORELASI

Korelasi merupakan teknik analisis yang termasuk dalam salah satu teknik pengukuran asosiasi / hubungan (measures of association). Pengakuan asosiasi merupakan istilah umum yang mengacu pada sekelompok teknik dalam statistic bivariate yang di gunnakan untuk mengukur kekuatan hubungan antara dua variabel. Diantara sekian banyak teknik-teknik pengukuran asosiasi terdapat dua teknik korelasi yang sangat popular sampai sekarang, yaitu Korelasi Pearson Product Moment dan Korelasi Rank Spearman. Pengukuran asosiasi mengenakan nilai numerik untuk mengetahui tingkatan asosiasi atau kekuatan hubungan antara variabel. Dua variabel dikatakan berasosiasi jika perilaku variabel yang satu mempengaruhi variabel yang lain. Jika tidak terjadi pengaruh, maka kedua variabel tersebut disebut independen.

Korelasi bermanfaat untuk mengukur kekuatan hubungan antara dua variabel atau lebih dengan skala-skala tertentu, misanya pearson data harus bersekala interval atau rasio. Spearman dan Kendal menggunakan skala ordinal. Kuat lemahnya hubungan di ukur menggunakan jarak (range) 0 sampai dengan 1. Korelasi mempunyai kemungkinan pengujian hipotesis dua arah (two tailed). Dikatakan korelasi searah jika koefesien korelasi ditemukan positif, sebalikanya jika koefisien korelasinya ditemukan negative maka di katakana korelasi tidak searah.

Yang dimaksud koefesien korelasi ialah suatu pengukuran statistic kovariasi atau asosiasi antara dua variabel. Jika koefesian korelasi diketemukan tidak sama dengan nol (0), maka terdapat hubungan antara dua variabel tersebut. Jika koefesien diketemukan +1, maka hubungan tersebut disebut hubungan korelasi sempurna atau hubungan linear sempurna dengan emiringan (slope) positif. Sebalikanya, jika koefesien diketemukan -1, maka hubungan tersebut disebut hubungan korelasi sempurna atau hubungan linear sempurna dengan kemiringan (slope) negatif.

Dalam korelasi sempurna tidak diperlukan lavi pengujian hipotesis mengenai signifikasi antara variabel yang dikorelasikan, karena kedua variabel mempunyai dua hubungan linear yang sempurna. Artinya variabel X mempunyai hubungan sangat kuat dengan variabel Y. jika korelasi sam dengan nol (0), maka tidak terdapat hubungan antara kedua variabel.

Pengukuran asosiasi berguna untuk mengukur kekuatan (strength) dan arah hubungan-hubungan antar dua variabel atau lebih. Contoh: mengukur hubungan antar dua variabel: 1) Motivasi kerja dengan produktifitas; 2) Kualitas layanan dengan kepuasan pelanggan; 3) Tingkat inflasi dengan IHSG.

1.3 KEGUNAAN KORELASI

Pengukuran ini membahas hubungan antar dua variabel untuk masing-masing kasus akan menghasilkan keputusan, diantaranya:

a). Hubungan kedua variabel tidak ada;

b). Hubungan kedua variabel lemah;

c). hubungan kedua variabel cukup kuat;

d). Hubungan kedua variabel kuat; dan

e). Hubungan kedua variabel sangat kuat;

Penentuan tersebut didasarkan pada kreteria yang menyebutkan jika hubungan mendekati 1, maka hubungan semakin kuat, sebaliknya jika hubungan mendekati nol (0), maka hubungan semakin lemah. Adapun Asumsi-asumsi dasar korelasi diantaranya ialah:

· Kedua variabel bersifat independen satu dengan yang lainnya, artinya masing-masing variabel berdiri sendiri dan tidak tergantung satu dengan yang lainnya.

· Tidak ada istilah variabel bebas dan variabel tegantung.

· Data untuk kedua variabel berdistribusi normal, artinya data yang distribusinya simestris sempurna. Jika digunakan Bahasa umum disebut berbentk kurva bel.

1.4 KARAKTERISTIK KORELASI

Beberapa karakteristik-karakteristik korelasi diantaranya:

1. Kisaran Korelasi: Kisaran (range) korelasi mulai dari nol (0) sampai satu (1), korelasi bisa pisitif dan bisa juga negatif.

2. Korelasi Sama Dengan Nol: Korelasi sama dengan 0 mempunyai arti tidak ada hubungan antra dua variabel.

3. Korelasi Sama Dengan Satu: Korelasi sam dengan +1, artinya kedua variabel mempunyai hubungan linier sempurna (membentuk garis lurus) positif. Korelasi seperti ini mempunyai makna jika nilai X naik, maka nilai Y juga naik.

4. Korelasi Sama Dengan Minus Satu: artinya kedua variabel mempunyai hubungan linier sempurna (membentuk garus lurus) negatif. Korelasi sempurna seperti ini mempunyai makna jika nilai X turun, maka nulai Y juga turun dan berlaku sebaliknya.

1.5 MACAM-MACAM KORELASI

1) Korelasi Poduct Moment (Pearson)

Korelasi Pearson Product Moment, yang merupakan pengukuran parametik, akan menghasilkan koefesien korelasi yang berfungsi untuk mengukur kekuatan hubungan linier antara dua variabel. Jika hubungan dua variabel tidak linier, maka koefesien krelasi pearson tersebut tidak mencerminkan kekuatan hubungan dua variabel yang sedang diteliti, meski kedua variabel mempunyai hubungan kuat. Simbol untuk korelasi Pearson adalah “p” jika diukur dalam populasi, dan “r” jika di ukur dalam sampel. Korelasi Pearson mempunyai jarak -1 sampai dengan +1. Jika koefisien korelasi adalah -1, maka kedua variabel yang diteliti mempunyai hubungan linier sempurna negatif. Jika koefisien korelasi adalah +1, maka kedua variabel yang diteliti mempunyai hubungan sempurna positif. Jika koefisien korelasi menunjukkan angka 0, maka tidak tidak terdapat hubungan antara dua variable yang dikaji. Jika hubungan dua variable linier sempurna, maka sebaran data tersebut akan membentuk garis lurus. Sekalipun demikian pada kenyataannya kita akan sulit menemukan data yang dapat mementuk garis linier sempurna.

Ø Syarat-syarat data yang digunakan dalam Korelasi Pearson, diantaranya:

o Bersekala interval/ rasio

o Variabel X dan Y harus bersifat independen satu dengan lainnya

o Variabel harus kuatitaif simetris

Ø Asumsi dalam Korelasi Pearson diantaranya ialah:

o Terdapat hubungan linier antara X dan Y

o Data yang berdistribusi normal

o Variabel X dan Y simetris, artinya variabel X tidak berfungsi sebagai variabel bebas dan Y sebagai variable tergantung

o Sampling representative

o Varian kedua variabel sama

Ø Prosedur Korelasi Pearson

o Siapkan data

o Membuat desain variabelnya

o Memasukkan dati dari urutan pertama sampai akhir

o Melakukan prosedur analisis

o Membuat inter pretasi

o Kesimpulan

2) Korelasi Spearman

Korelasi Spearman merupakan korelasi non-parametik. Koefisien korelasi ini mempunyai symbol r (rho). Pengukuran dengan menggunakan korelasi Spearman digunakan untuk menilai adanya seberapa baik fungsi monotik (suatu fungsi yang sesuai perintah) arbiter digunakan untuk menggambarkan hubungan dua variabel dengan tanpa membuat asumsi distribusi frekuensi dari variabel-variabel yang diteliti. Nilai koefisien korelasi dan kreteria penilaian kekuatan hubungan dua variabel sama dengan yang digunakan dalam korelasi Pearson. Penghitungan dilakukan dengan cara yang sama dengan korelasi Pearson, perbedaan terletak pada hubungan data kedalam bentuk rangking sebelum dihitung koefisien korelasinya. Itulah sebabnya korelasi ini disebut sebagai Korelasi Rank Spearman.

Ø Syarat-sayarat dan Asumsi Penggunaan Korelasi Rank Spearman

Data yang digunakan harus bersekala ordinal. Berbeda denga Korelasi Pearson, Korelasi Spearman tidak memerlukan adanya hubungan linier dalam variabel-variabel yang diukur dan tidak perlu menggunakan data yang bersifat interval, tapi cukup dengan menggunakan data ordinal. Asumsi yang digunakan dalam korelasi ini adalah tingkatan (rank) berikutnya harus menunjukkan posisi jarak yang sama pada variabel-variabel yang di ukur. Jika menggunakan skala Likert, maka jarak skala yang digunakan harus sama. Juga, data tidak harus berdistribusi normal.

Ø Prosedur Korelasi Spearman

o Siapkan data

o Membuat desain variabelnya

o Memasukkan data

o Melakukan prosedur analisis

o Mengenterpretasi hasil

o Kesimpulan

3) Korelasi Kendall’s Tau

Korelasi Kendall’s Tau digunakan untuk mengukur kekuatan hubungan dua variabel. Korelasi ini sama dengan Korelasi Spearman yang dikategorokan sebagai statistic non-parametik. Data yang digunakan bersekala ordinal dan tidak harus berdistribusi normal.

Ø Prosedur Korelasi Kendall’s Tau

o Siapkan data

o Membuat desain variabelnya

o Masukkan data

o Melakukan analisis

o Membuat interpretasi

o Kesimpulan

4) Korelasi Parsial

Korelasi Parsial merupakan korelasi antara dua variabel ketika pengaruh dari satu atau lebih variabel yang berhubungan yang berperan sebagai variabel ketiga dikendalikan atau diparsialkan. Tujuannya ialah untuk memperoleh varian unik dalam hubungan antare kedua variabel yang dikorelasikan dan menghilangkan varian variabel ketiga yang dapat berpengaruh terhadap hubungan kedua variabel tersebut. vasiavel yang diteliti harus kontinus dan bersekala interval. Hubungan antar bvariabel bersifat linier dan data harus berdistribusi normal. Korelasi parsal hanya digunakan jika variabel ketiga mempunyai keterkaitan dengan salah satu variabel yang kita korelasikan.

Ø Prosedur Korelasi Parsial

o Siapkan data

o Membuat desain variabelnya

o Memasukkan data

o Melakukan analisis

o Membuat interpretasi

5) Korelasi Point Biserial

Korelasi ini digunakan untuk menganalisis hubungan antara data interval/rasio dengan data dikotomi (murni).

6) Korelasi Biserial

Korelasi ini digunakan untuk menganalisis hubungan data interval/rasio dengan data dikotomi (buatan).

7) Korelasi Phi (Koefesien Phi)

Korelasi ini digubakan untuk analisis hubungan antara data nominal dikotomi dangan data dikotomi.

8) Korelasi Koefesien Kontegensi

Korelasi ini digunakan untuk menganalisis hubungan antara data nominal (politomi) dengan data nominal (politomi).

9) Korelasi Ganda

Korelasi ganda (multiple correlation) adalah korlasi antara dua atau lebih variabel bebas (independent) secara bersama-sama dengan satu variabel terikat (dependent). Angka yang menunjukkan arah dan besar kuatnya hubungan antara dua atau lebih variabel bebas dengan satu variabel tarikat disebut koefesien korelasi ganda dan di simbolkan R.

10) Koefisien Determinasi

Koefisien determinasi dilambangan dengan r². Nilai ini menyatakan proporsi variasi keseluruhan dalam nilai variabel dependent yang dapat diterangkan atau diakibatkan oleh hubungan linier dengan variabel independent, selain itu (sisanya) diterngakan oleh variabel yang lain (galat atau peubahan lainnya). Nilai koefisien determinasi dinyatakan dalam kuadrat dari nilai koefesien korelasi r² x 100%= n%, memiliki makna bahwa nilai variabel dependent dapat diterangkan oleh variabel independent sebesar n%, sedangkan sisanya sebesar (100-n) % diterangkan oleh gelat (error) atau pengaruh variabel yang lain. Sedangkan untuk analisis korelasi dengan jumlah variabel dependent lebih dari satu (ganda/majemuk), terdapat koefisien determinasi penyesuaian (adjustment) yang sangat sensitive dengan jumlah variabel. Biasanya untuk analisis korelasi majemuk/ganda yang sering dipakai adalah koefisien dterminasi penyesuaian (koefisien determinasi sederhana tidak memperhatikan jumlah variabel independent). Rumus yang dipakai adalah:

KD = r² x 100%

KD = Koefisien Determinasi

r = Koefisien Korelasi

2.1 REGRESI

Istilah regresi pertama kali dalam konsep statistik digunakan oleh Sir Francis Galton dimana yang bersangkutan melakukan kajian yang menunjukkan bahwa tinggi badan anak-anak yang dilahirkan dari para orang tua yang tinggi cenderung bergerak (regress) kearah ketinggian rata-rata populasi secara keseluruhan. Galton memperkenalkan kata regresi (regression) sebagai nama proses umum untuk memprediksi satu variabel, yaitu tinggi badan anak dengan menggunakan variabel lain, yaitu tinggi badan orang tua. Pada perkembangan berikutnya hukum Galton mengenai regresi ini ditegaskan lagi oleh Karl Pearson dengan menggunakan data lebih dari seribu. Pada perkembangan berikutnya, para ahli statistik menambahkan isitilah regresi berganda (multiple regression) untuk menggambarkan proses dimana beberapa variabel digunakan untuk memprediksi satu variabel lainnya.

Regresi dalam pengertian moderen menurut Gujarati (2009) ialah sebagai kajian terhadap ketergantungan satu variabel, yaitu variabel tergantung terhadap satu atau lebih variabel lainnya atau yang disebut sebagai variabel – variabel eksplanatori dengan tujuan untuk membuat estimasi dan / atau memprediksi rata – rata populasi atau nilai rata-rata variabel tergantung dalam kaitannya dengan nilai – nilai yang sudah diketahui dari variabel ekslanatorinya. Selanjutnya menurut Gujarati meski analisis regresi berkaitan dengan ketergantungan atau dependensi satu variabel terhadap variabel – variabel lainnya hal tersebut tidak harus menyiratkan sebab – akibat (causation). Dalam mendukung pendapatnya ini, Gujarati mengutip pendapat Kendal dan Stuart yang diambil dari buku mereka yang berjudul “The Advanced Statistics” yang terbit pada tahun 1961 yang mengatakan bahwa,” suatu hubungan statistik betapapun kuat dan sugestifnya tidak akan pernah dapat menetapkan hubungan sebab akibat (causal connection); sedang gagasan mengenai sebab akibat harus datang dari luar statistik, yaitu dapat berasal dari teori atau lainnya”.

Sedang menurut Levin & Rubin (1998:648), regresi digunakan untuk menentukan sifat – sifat dan kekuatan hubungan antara dua variabel serta memprediksi nilai dari suatu variabel yang belum diketahui dengan didasarkan pada observasi masa lalu terhadap variabel tersebut dan variabel-variabel lainnya. Selanjutnya dalam regresi kita akan mengembangkan persamaan estimasi (estimating equation), yaitu rumus matematika yang menghubungkan variabel-variabel yang diketahui dengan variabel-variabel yang tidak diketahui. Setelah dipelajari pola hubungannya, kemudian kita dapat mengaplikasikan analisis korelasi (correlation analysis) untuk menentukan tingkatan dimana variabel – variabel tersebut berhubungan. Kesimpulannya, analisis korelasi mengungkapkan seberapa benar persamaan estimasi sebenarnya menggambarkan hubungan tersebut. Lebih lanjut Levin & Rubin mengatakan bahwa: “ Kita sering menemukan hubungan sebab akibat antar variabel – variabel; yaitu variabel bebas ‘menyebabkan’ variabel tergantung berubah. Sekalipun demikian mereka melanjutkan bahwa: “penting untuk kita perhatikan bahwa yang kita anggap hubungan (relationship) yang diketemukan melalui regresi sebagai hubungan asosiasi (relationship of association) tetapi tidak selalu harus sebab dan akibat (cause and effect). Kecuali kita mempunyai alasan – alasan khusus untuk percaya bahwa (perubahan pada) nilai – nilai variabel tergantung disebabkan oleh nilai –2

nilai variabel (variabel) bebas; jangan menyimpulkan (infer) hubungan sebab akibat dari hubungan yang diketemukan dalam regresi.

Karena Levin & Rubin dalam mendefinisikan regresi juga menggunakan istilah “analisis korelasi”, maka sebaiknya dalam bagian ini penulis perlu menjelaskan perbedaan antara regresi dan korelasi. Menurut Gujarati (2009: 20) analisis korelasi bertujuan untuk mengukur kekuatan (strength) atau tingkatan (degree) hubungan linier (linear association) antara dua variabel. Untuk mengukur kekuatan hubungan linier ini digunakan koefesien korelasi. Sebaliknya dalam regresi kita tidak melakukan pengukuran seperti itu. Dalam regresi kita membuat estimasi atau memprediksi nilai rata-rata satu variabel didasarkan pada nilai – nilai tetap variabel – variabel lain. Perbedaan yang mendasar antara regresi dan korelasi ialah dalam regresi terdapat (hubungan) asimetri dalam kaitannya dengan perlakuan terhadap variabel tergantung dan variabel bebas. Variabel tergantung diasumsikan statistitikal, acak atau stokhastik, yaitu mempunyai distribusi probabilitas. Sedang variabel bebas / prediktornya diasumsikan mempunyai nilai – nilai tetap. Sebaliknya dalam korelasi kita memperlakukan dua variabel atau variabel – variabel apa saja secara simetris, yaitu tidak ada perbedaan antara variabel bebas dan variabel tergantung. Sebagai contoh korelasi antara nilai ujian matematik dan statistik sama dengan korelasi nilai ujian statistik dan matematik. Lebih lanjut dalam korelasi kedua variabel diasumsikan random.

Regresi linier mempunyai persamaan yang disebut sebagai persamaan regresi. Persamaan regresi mengekspresikan hubungan linier antara variabel tergantung / variabel kriteria yang diberi simbol Y dan salah satu atau lebih variabel bebas / prediktor yang diberi simbol X jika hanya ada satu prediktor dan X1, X2 sampai dengan Xk, jika terdapat lebih dari satu prediktor (Crammer & Howitt, 2006:139). Persamaan regresi akan terlihat seperti di bawah ini:

· Untuk persamaan regresi dimana Y merupakan nilai yang diprediksi, maka persamaannya ialah:

Y = a + β1X1 (untuk regresi linier sederhana)

Y = a + β1X1 + β2X2 + … + βkXk (untuk regresi linier berganda)

· Untuk persamaan regresi dimana Y merupakan nilai sebenarnya (observasi), maka persamaan menyertakan kesalahan (error term / residual) akan menjadi:

Y = a + β1X1 + e (untuk regresi linier sederhana)

Y = a + β1X1 + β2X2 + … + βkXk + e (untuk regresi linier berganda)

Dimana:

· X : merupakan nilai sebenarnya suatu kasus (data)

· β : merupakan koefisien regresi jika hanya ada satu prediktor dan koefisien regresi parsial jika terdapat lebih dari satu prediktor. Nilai ini juga mewakili mewakili koefesien regresi baku (standardized) dan koefisien regresi tidak baku (unstandardized). Koefesien regresi ini merupakan jumlah perubahan yang terjadi pada Y yang disebabkan oleh perubahan nilai X. Untuk menghitung perubahan ini dapat dilakukan dengan cara mengkalikan nilai prediktor sebenarnya (observasi) untuk kasus (data) tertentu dengan koefisien regresi prediktor tersebut.

· a : merupakan intercept yang merupakan nilai Y saat nilai prediktor sebesar nol.

Sedang garis regresi didefinisikan sebagai garis lurus yang ditarik dari titik – titik diagram pencar (scattered diagram) dari nilai variabel tergantung dan variabel bebas sehingga garis tersebut menggambarkan hubungan linier antara variabel-variabel tersebut. Jika nilai-nilai ini merupakan garis regresi nilai baku maka garis ini sama dengan garis korelasi. Garis ini disebut juga sebagai garis kecocokan yang sempurna dimana garis lurus tersebut berada pada posisi terdekat pada titik-titik diagram pencar. Garis ini dapat digambarkan dari nilai-nilai persamaan regresi dalam bentuk yang paling sederhana yaitu:

Nilai yang diprediksi = intercept + (koefisien regresi x nilai prediktor)

Sumbu vertikal dari diagram pencar digunakan untuk menggambarkan nilai-nilai variabel tergantung sedang sumbu horizontal menggambarkan nilai prediktor. Intercept merupakan titik sumbu vertikal yang merupakan nilai variabel tergantung yang diprediksi saat nilai prediktor atau variabel bebas sebesar nol. Nilai yang diprediksi akan sebesar akan sebesar 0 jika koefisien regresi baku digunakan. Itulah sebabnya saat menggunakan IBM SPSS keluaran yang digunakan dalam koefisien regresi menggunakan keluaran pada kolom “unstandardized coefficient”.

Jika digambarkan akan nampak seperti di bawah ini:

Gambar 1.1 Garis Regresi

Persamaannya ialah:

Y = a + β1X1

Dengan:

Y= variabel tergantung / variabel kriteria

a= intercept Y

β = kemiringan (slope)

X= variabel bebas

Garis regresi mempunyai 3 (tiga) kemungkinan yaitu:

1) hubungan linier positif,

2) hubungan linier negatif, dan

3) tidak ada hubungan linier.

Gambarnya seperti di bawah ini:

1) Hubungan Linier Positif

Gambar 1.2 Hubungan Linier Positif

2) Hubungan Linier Negatif

Gambar 1.3 Hubungan Linier Negatif

3) Tidak ada Hubungan Linier

Gambar 1.4 Tidak Ada Hubungan Linier

Ø Istilah-istilah yang mewakili pengertian variabel bebas dan variabel tergantung dalam regresi. Gujarati memberikan istilah sebagai berikut:

· Variabel tergantung (dependent variable): disebut juga sebagai variabel yang dijelaskan (explained variable) / variabel yang diprediksi (predictand) / regresan (regressand) / variabel yang merespon ( response) / endegenous / keluaran (outcome) / variabel yang dikontrol (controlled variable).

· Variabel yang menerangkan (explanatory variable): disebut juga sebagai variabel tergantung (dependent variable) / variabel yang memprediksi (predictor) / regresor (regressor) / variabel stimulus ( stimulus) / exogenous / kovariat (covariate) / variabel kontrol (control variable).

2.2 Tujuan

Tujuan menggunakan analisis regresi ialah:

· Membuat estimasi rata-rata dan nilai variabel tergantung dengan didasarkan pada nilai variabel bebas.

· Menguji hipotesis karakteristik dependensi

· Untuk meramalkan nilai rata-rata variabel bebas dengan didasarkan pada nilai variabel bebas diluar jangkauan sampel

2.3 Asumsi Penggunaan Regresi

Penggunaan regresi linier sederhana didasarkan pada asumsi diantaranya sbb:

· Model regresi harus linier dalam parameter

· Variabel bebas tidak berkorelasi dengan disturbance term (Error) .

· Nilai disturbance term sebesar 0 atau dengan simbol sebagai berikut: (E (U / X) = 0

· Varian untuk masing-masing error term (kesalahan) konstan

· Tidak terjadi otokorelasi

· Model regresi dispesifikasi secara benar. Tidak terdapat bias spesifikasi dalam model yang digunakan dalam analisis empiris.

· Jika variabel bebas lebih dari satu, maka antara variabel bebas (explanatory) tidak ada hubungan linier yang nyata

2.4 Syarat-syarat Regresi

Model kelayakan regresi Linier dalam IBM SPSS didasarkan pada hal-hal sebagai berikut:

a. Model Regeresi dikatakan layak jika angka signofikasi pada ANOVA sebesar <0.05

b. Predictor yang digunakan sebagai variabel bebas harus layak. Kelayakan ini diketahui jika angka Standart error of estimasi < Standart Deviation.

c. Koefesien regresiharus signifikan. Pengujian dialakukan dengan uji t. koefesien regresi signifikan jika t hitung > t table (nilai kritis). Dalam IBM SPSS dapat diganti dengan menggunakan nilai signifikansi (sig) dengan ketentuan sebagai berikut:

o Jika sig > 0.05; koefesien regresi tidak signifikan.

o Jika sig < 0.05; koefesien regresi signifikan.

d. Tidak boleh terjadi multikolinieritas, artinya tidak boleh terjadi korelasi antar variabel bebas yang sangat tinggi atau terlalu rendah. Syarat ini hanya berlaku untuk regresi linier berganda dengan variabel bebas lebih dari satu. Terjadi multikolinieritas jika koefesien korelasi antara variable bebas > 0,7 atau < - 7.

e. Tidak terjadi otokorelasi jika: - 2 ≤ DW ≤ 2.

f. Keselerasan model regresi dapat diterangkan dengan menggunakan nilai r2 semakin besar nilai tersebut maka model semakin baik. Jika nilai mendekati 1 maka model regresi semakin baik. Nilai r2 mempunyai karakteristik diantaranya: 1) selalu positif, 2) Nilai r2 maksimal sebesar 1. Jika Nilai r2 sebesar 1 akan mempunyai arti kesesuaian yang sempurna. Maksudnya seluruh variasi dalam variabel tergantung (variabel Y) dapat diterangkan oleh model regresi. Sebaliknya jika r2 sama dengan 0, maka tidak ada hubungan linier antara variabel bebas (variabel X) dan variabel tergantung (variabel Y).

g. Terdapat hubungan linier antara variabel bebas (X) dan variabel tergantung (Y).

h. Data harus berdistribusi normal

i. Data berskalainterval atau rasio

j. Terdapat hubungan dependensi, artinya satu variabel merupakan variabel tergantung yang tergantung pada variabel-variabel lainnya.

2.5 Konsep Linieritas Dalam Regresi

Ada dua macam linieritas dalam analisis regresi, yaitu linieritas dalam variabel dan linieritas dalam parameter. Yang pertama, linier dalam variabel merupakan nilai rata-rata kondisional variabel tergantung yang merupakan fungsi linier dari variabel (variabel) bebas. Sedang yang kedua, linier dalam parameter merupakan fungsi linier parameter dan dapat tidak linier dalam variabel.

Setiap analisis regresi pasti ada korelasinya, tetapi analisis korelasi belum tentu dilanjutkan dengan analisis regresi. Analisis korelasi yang dilanjutkan dengan analisis regresi yaitu apabila korelasi mempunyai hubungan kausal (sebab-akibat) atau hubungan fungsional. Untuk menetapkan dua variabel mem[unyai hubungan kausal atau tidak, harus didasarkan pada teori atau konsep-konsep tentang dua variabel tersebut. Analisis regresi digunakan untuk mengetahui bagaimana pola variabel dependent (kriteria) dapat dipredeksikan melalui variabel independent (prediktor)[3].

Regresi yang berarti peramalan, penaksiran, atau pendugaan pertamakali diperkenalkan pada tahun 1877 oleh Sir Francis Galton (1822-1911) sehubungan dengan penelitiannya tentang tinggi manusia. Penelitian tersebut membandingkan tinggi badan anak laki-laki dengan tinggi badan ayahnya.

2.6 Macam-macam Regresi

1. Regresi Linier Sederhana

Yaitu regresi linier dengan variabel prediktor (bebas). Regresi Linear Sederhana adalah Metode Statistik yang berfungsi untuk menguji sejauh mana hubungan sebab akibat antara Variabel Faktor Penyebab (X) terhadap Variabel Akibatnya. Faktor Penyebab pada umumnya dilambangkan dengan X atau disebut juga dengan Predictor sedangkan Variabel Akibat dilambangkan dengan Y atau disebut juga dengan Response. Regresi Linear Sederhana atau sering disingkat dengan SLR (Simple Linear Regression) juga merupakan salah satu Metode Statistik yang dipergunakan dalam produksi untuk melakukan peramalan ataupun prediksi tentang karakteristik kualitas maupun Kuantitas.

Bentuk persamaan:
Ŷ = a + bx

Ŷ = bariabel dependent/kreteria (yang diprediksikan)
a = konstanta (harga Y untuk X = 0)
b = angka arah (koefisien regresi) ; bila b positif (+), arah regresi naik dan bila b negative (-), arah regresi turun.
x = variabel independent (predictor)

Persamaan garis regresi linier sederhanaya dapat dinyatankan dalam bentuk, rata-rata Y bagi X tertentu. Konstanta atau parameter atau koefisien regresi populasi. Karena populasi jarang diamati secara langsung, maka digunakan persamaan regresi linier sederhana sampel sebagai penduga persamaan regresi linier sederhana populasi.

Persamaan memberikan arti jika variabel X mengeluarkan satu satuan, maka variabel Y akan mengalami peningkatan atau penurunan sebesar 1b b. untuk membuat peramalan, penaksiran atau pendugaan dengan persamaan regresi, maka nilai a dan b harus ditentukan terlebih dahulu. Dengan metode uadrat terkeci (least square), nilai a dan b dengan rumus diatas.

2. Regresi Linier Berganda

Jika dalam regeresi linier sederhana hanya da satu perubahan bebas (X) yang dihubungkan dengan perubahan tidak bebas (Y) sedangkan dalam regresi linier berganda ada beberapa variabel bebas (X₁), (X₂), (X₁) dan (X_n) yang merupakan bagian dari analisis multivariant dengan tujuan untuk menduga besarnya koefisien regresi yang akan menunjukkan besarnya pengaruh beberapa variabel bebas independent terhadap variabel tidak bebas dependent. Dalam uji regresi berganda seluruh variabel predictor (bebas) dimasukkan ke dalam regresi secara serentak. Jadi, peneliti bisa menciptakan persamaan regresi guna memprediksi variabel terikat dengan memasukkan, secara serentak variabel bebas. Persamaan regresi kemudian menghasilkan konstanta dan koifisien regresi bagi masing-masing variabel bebas[4].

C. KESIMPULAN

Korelasi merupakan hubungan antara dua kejadian dimana kejadian yang satu dapat mempengaruhi eksistensi kejadian yang lain, misalnya kejadian X mempengaruhi kejadian Y. apabila dua variabel X dan Y mempunyai hubungan, maka nilai variabel X yang sudah diketahui dapat dipergunakan untuk memperkirakan/menaksir atau meramalkan Y. ramalan pada dasarnya merupakan perkiraan/taksiran mengenai suatu kejadian (nilai suatu variabel) untuk suatu kejadian yang akan datang. Variabel yang nilanya akan di ramalkan disebut variabel tidak bebas (dependent variable), sedangkan variabel C yang nilainya akan dipergunakan untuk meramalkan untuk meramalkan nilai variabel Y disebut variabel bebas (independent variable), atau variabel peramal (predictor) atau seringkali disebut variabel yang menerangkan (explanatory).

Jadi analisis korelasi ini memungkinkan kita untuk mengetahui suatu di luar hasil penyelidikan, salah satu cara untuk melakukan peramalan dengan menggunakan garis regresi. Untuk menghitung parameter yang akan dijadikan dalam penentuan antara hubungan dua variabel, dengan beberapa cara yaitu: koefisien detremninasi, koefisien korelasi. Apabila terdapat data berkelompok menggunakan koefisien data berkelompok dan bila menggunakan data bergandamaksudnya variabel bebas yang mempengaruhi variabel terikat ada dua, maka menggunakan koefisien berganda.

DAFTAR PUSTAKA

Dr. Supardi U.S. MM., Mpd. 2013. Aplikasi Statatistika Dalam Penelitian ‘’Konsep Statistika Yang Lebih Komprehensif’’. Adikita, Jakarta selatan, Indonesia.

http://jokofirmantoro.blogspot.com/2013/06/regresi-linier-sederhana.html.

Drs. Mardalis. 1993. Metode Penelitian ‘’Suatu Pendekatan Proposal’’. Ed. 1, Cet. 2, Bumi Aksara, Jakarta, Indonesia.

Dajan, Anto. 1996. Pengantar Metode Statistik Jilid II. PT Pustaka LP3ES Indonesia, Jakarta.

Jonathan Sarwono, Korelasi dan Regresi Linier. Pdf

Sudjana. 2005. metode Statistika. Bandung: Tarsito

[1] Sudjana (1986:3)

[2] Sudjiono (2006)

[3] Dr. Supardi U.S. MM., MPd, Aplikasi Statistika Dalam Penelitian konsep statistika yang lebih konprehensif. Hal 229.

[4] Ibid ⁽¹⁾ hal 11.

Belajar Bareng

Thursday, May 1, 2014

STATISTIK KORELASI DAN REGRESI

About

Blogroll