Regresi linear

Revisi sejak 3 Desember 2018 19.34 oleh AABot (bicara | kontrib) (Bot: Perubahan kosmetika)

Dalam statistika, regresi linear adalah sebuah pendekatan untuk memodelkan hubungan antara variable terikat Y dan satu atau lebih variable bebas yang disebut X [1]. Salah satu kegunaan dari regresi linear adalah untuk melakukan prediksi berdasarkan data-data yang telah dimiliki sebelumnya. Hubungan di antara variable-variabel tersebut disebut sebagai model regresi linear. Berdasarkan penggunaan variable bebas, maka regresi linear dapat dibagi menjadi dua, yaitu regresi linear univariate dan regresi linear multivariate.

Regresi Linear Univariate

Pada regresi linear univariate, variable bebas yang terlibat hanya satu saja. Oleh karena hanya memiliki satu variable bebas, maka hanya akan terdapat variable input X dan output Y. Kedua variable ini akan dimodelkan sebagai sumbu X dan Y pada diagram kartesius. Pada regresi linear tipe ini, model regresi linear ditentukan sebagai berikut.

 

dimana   merupakan nilai yang akan dicari sedemikian sehingga nilai   menjadi optimal dan   merupakan variable bebas atau input. Proses pencarian nilai   dapat dilakukan dengan beberapa cara diantaranya dengan menggunakan pendekatan least square, maximum likehood, atau algoritme gradient descent. Pada dasarnya, pencarian nilai   dilakukan hingga nilai error yang dihasilkan merupakan nilai yang paling minimal [2]. Fungsi error yang digunakan adalah sebagai berikut.

 

Dimana   merupakan banyaknya data input,   merupakan model regresi linear, dan   adalah target output yang seharusnya.

Regresi Linear Multivariate

Pada regresi linear multivariate, variable bebas yang terlibat tidak hanya satu saja melainkan beberapa variable bebas. Hal ini dikarenakan input yang digunakan lebih dari satu dimensi. Oleh karena itu, diperlukanlah sebuah model regresi linear yang berbeda dari regresi linear univariate. Model regresi linear multivariate dapat ditentukan sebagai berikut.

 

 

Dimana   juga merupakan nilai yang akan dicari sedemikian sehingga nilai   menjadi optimal dan   merupakan variable bebas atau input. Proses pencarian nilai   juga masih dapat dilakukan dengan menggunakan cara yang sama dengan regresi linear univariate, yaitu dengan menggunakan pendekatan least square, maximum likehood, atau algoritme gradient descent. Pada dasarnya, pencarian nilai   dilakukan hingga nilai error yang didapatkan dari fungsi error merupakan nilai yang paling minimal [2]. Fungsi error yang digunakan masih sama dengan regresi linear univariate.

Regresi Linear dengan menggunakan RStudio

#REGRESI LINEAR
#Input
data = read.table("nama file.txt", header = TRUE)
x #variabel bebas
y #vaiabel terikat

#Scatterplot untuk x dan y
plot(x,y)

#Korelasi dan Kovariansi
cor(x,y)
cov(x,y)

#Koefisien Model
model = lm(y ~ x)
summary(model) #Informasi yang didapat adalah koefisien model, p-value, r-squared

#Plot model
abline(model)

#Residual
model.res = resid(model)
plot(x, model.res, ylab="y", xlab="x", main="Plot Residual")

#Kenormalan Residual
model.stdres = rstandard(model)

#Plot Kenormalan Residual
qqnorm(model.stdres, ylab="Standarized Residuals", xlab="Normal Scores", main="Plot Kenormalan Residual")

Pengujian apakah X berpengaruh terhadap Y

 

 

Jika  Hitung  Tabel atau p-value   maka  tidak ditolak

Jika  Hitung  Tabel atau p-value   maka   ditolak

Referensi

  1. ^ http://en.wiki-indonesia.club/wiki/Linear_regression
  2. ^ a b Stuart Russell and Peter Norvig. 2009. Artificial Intelligence: A Modern Approach (3rd ed.). Prentice Hall Press, Upper Saddle River, NJ, USA