Regresi linear: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
Regresi linear dengan RStudio
Irul07 (bicara | kontrib)
Tidak ada ringkasan suntingan
Tag: VisualEditor Suntingan perangkat seluler Suntingan peramban seluler Tugas pengguna baru Newcomer task: copyedit
 
(24 revisi perantara oleh 12 pengguna tidak ditampilkan)
Baris 1:
Dalam statistika,Statistik '''regresi linear''' adalah sebuahmerupakan pendekatan untuk memodelkan hubungan antara variablesuatu terikat(satu Yatau danlebih) variabel dependen dengan satu atau([[regresi lebihlinear variablesederhana]]) bebas yangatau disebutlebih Xvariabel independen (regresi <reflinier name="engWiki"/>banyak). Salah satu kegunaanaplikasi dari regresi linearlinier adalah untuk melakukan prediksi berdasarkan data-data yang telah dimiliki sebelumnya. HubunganDengan asumsi hubungan di antara variablevariabel-variabel tersebut disebutdapat sebagaididekati modeloleh regresisuatu linear.persamaan Berdasarkangaris penggunaan variable bebaslurus, maka regresimodel linearyang dapatmendekati dibagihubungan menjadiantar dua,variabel yaitudi regresidata lineartersebut univariatedisebut dansebagai model regresi linear multivariate.
 
=== Regresi Linear ''Univariate'' ===
Pada regresi linear univariate, variablevariabel bebas yang terlibat hanya satu saja. Oleh karena hanya memiliki satu variablevariabel bebas, maka hanya akan terdapat variablevariabel input X dan output Y. Kedua variablevariabel ini akan dimodelkan sebagai sumbu X dan Y pada diagram kartesius. Pada regresi linear tipe ini, model regresi linear ditentukan sebagai berikut.
 
<math>h_w(x) = w_1x+w_0</math>
 
dimana <math>w</math> merupakan nilai yang akan dicari sedemikian sehingga nilai <math>w</math> menjadi optimal dan <math>x</math> merupakan variable bebas atau input. Proses pencarian nilai <math>w</math> dapat dilakukan dengan beberapa cara diantaranya dengan menggunakan pendekatan ''least square'', ''maximum likehood'', atau algoritme ''gradient descent''. Pada dasarnya, pencarian nilai <math>w</math> dilakukan hingga nilai error yang dihasilkan merupakan nilai yang paling minimal .<ref name="russelBook" />. Fungsi error yang digunakan adalah sebagai berikut.
 
<math>E(w) = \frac{1}{2N} \sum_{i=1}^{N}(h_w(x^i)-t^i)^2</math>
Baris 12:
Dimana <math>N</math> merupakan banyaknya data input, <math>h_w(x^i )</math> merupakan model regresi linear, dan <math>t</math> adalah target ''output'' yang seharusnya.
 
=== Regresi Linear ''Multivariate'' ===
Pada regresi linear multivariate, variable bebas yang terlibat tidak hanya satu saja melainkan beberapa variable bebas. Hal ini dikarenakan input yang digunakan lebih dari satu dimensi. Oleh karena itu, diperlukanlah sebuah model regresi linear yang berbeda dari regresi linear univariate. Model regresi linear multivariate dapat ditentukan sebagai berikut.
 
Baris 19:
<math>h_w(x) = w_0+\sum_{i=0}^{m}w_ix_i</math>
 
Dimana <math>w</math> juga merupakan nilai yang akan dicari sedemikian sehingga nilai <math>w</math> menjadi optimal dan <math>x</math> merupakan variable bebas atau input. Proses pencarian nilai <math>w</math> juga masih dapat dilakukan dengan menggunakan cara yang sama dengan regresi linear ''univariate'', yaitu dengan menggunakan pendekatan ''least square'', ''maximum likehood'', atau algoritme ''gradient descent''. Pada dasarnya, pencarian nilai <math>w</math> dilakukan hingga nilai error yang didapatkan dari fungsi error merupakan nilai yang paling minimal .<ref name="russelBook"/>. Fungsi error yang digunakan masih sama dengan regresi linear ''univariate''.
 
=== Referensi ===
=== Regresi Linear dengan menggunakan RStudio ===
<syntaxhighlight lang="r">
#REGRESI LINEAR
#Input
data = read.table("nama file.txt", header = TRUE)
x #variabel bebas
y #vaiabel terikat
 
#Scatterplot untuk x dan y
plot(x,y)
 
#Korelasi dan Kovariansi
cor(x,y)
cov(x,y)
 
#Koefisien Model
model = lm(y ~ x)
summary(model) #Informasi yang didapat adalah koefisien model, p-value, r-squared
 
#Plot model
abline(model)
 
#Residual
model.res = resid(model)
plot(x, model.res, ylab="y", xlab="x", main="Plot Residual")
 
#Kenormalan Residual
model.stdres = rstandard(model)
 
#Plot Kenormalan Residual
qqnorm(model.stdres, ylab="Standarized Residuals", xlab="Normal Scores", main="Plot Kenormalan Residual")
 
</syntaxhighlight>
 
==== Pengujian apakah X berpengaruh terhadap Y ====
<math display="inline">H_0 : \beta_0 = 0 \ \ dan \ \ \beta_1 = 0
</math>
 
<math>H_1 : \beta_0 \neq 0 \ \ dan \ \ \beta_1 \neq 0</math>
 
Jika <math>F</math><sub>Hitung</sub> <math>< F</math><sub>Tabel</sub> atau p-value <math>> \alpha</math> maka <math>H_0</math>tidak ditolak
 
Jika <math>F</math><sub>Hitung</sub> <math>> F</math><sub>Tabel</sub> atau p-value <math>< \alpha</math> maka <math>H_0</math> ditolak
 
=== Referensi ===
<references>
<ref name="engWiki">http://en.wiki-indonesia.club/wiki/Linear_regression</ref>
<ref name="russelBook">Stuart Russell and Peter Norvig. 2009. Artificial Intelligence: A Modern Approach (3rd ed.). Prentice Hall Press, Upper Saddle River, NJ, USA</ref>
</references>
 
{{Authority control}}
 
[[Kategori:Matematika]]