Memperluas regresi linier ke banyak variabel — fondasi utama jaringan saraf tiruan
Pada bab sebelumnya, kita telah mempelajari regresi linier sederhana dengan satu input dan satu output:
Namun di dunia nyata, prediksi jarang hanya bergantung pada satu faktor saja. Contoh:
Untuk menangani banyak faktor (fitur/variabel), kita menggunakan Multiple Linear Regression (Regresi Linier Berganda):
Setiap fitur xi memiliki bobot (weight) wi sendiri yang menentukan seberapa besar pengaruh fitur tersebut terhadap prediksi.
Di bawah ini adalah visualisasi pseudo-3D dari regresi dengan 2 fitur (x₁ dan x₂) memprediksi y. Atur bobot dan bias untuk melihat bagaimana bidang regresi berubah.
Ketika kita memiliki n sampel data, masing-masing dengan m fitur, kita bisa menyusunnya sebagai matriks:
Animasi di bawah menunjukkan proses perkalian matriks baris demi baris:
Untuk mengukur seberapa baik model kita, digunakan Mean Squared Error:
Setiap selisih antara nilai aktual dan prediksi dikuadratkan, kemudian dirata-ratakan. Semakin kecil MSE, semakin baik modelnya.
Berikut data kecil berisi 6 rumah. Fitur: Luas (m²) dan Jumlah Kamar. Target: Harga (juta Rp).
| # | Luas (m²) | Jumlah Kamar | Harga Aktual (juta Rp) | Prediksi | Error² |
|---|---|---|---|---|---|
| MSE = | -- | ||||
Sebuah neuron tunggal dengan banyak input sebenarnya adalah regresi linier multivariat ditambah fungsi aktivasi!
Memahami regresi multivariat adalah langkah fundamental sebelum mempelajari neural network. Tapi pertanyaan besarnya: bagaimana kita menemukan bobot terbaik secara otomatis?
Jawabannya ada di Bab 5: Gradient Descent — algoritma optimasi yang menjadi jantung dari semua pelatihan model machine learning dan deep learning.