Perbezaan antara kecenderungan pembelajaran mesin dan varians

3904
211
Johnnie Purdy

Kami hidup di dunia di mana algoritma di mana -mana dan ramai di antara kita menggunakannya, mungkin juga tidak menyedari bahawa algoritma terlibat. Untuk menyelesaikan masalah di komputer, kami memerlukan algoritma. Pembelajaran Mesin Bergantung pada sejumlah algoritma untuk mengubah set data menjadi model. Bias dan varians adalah dua konsep asas untuk pembelajaran mesin. Penting untuk memahami kedua -dua ketika datang ke ketepatan dalam mana -mana algoritma pembelajaran mesin.

Apa itu Bias?

Ralat ramalan untuk mana -mana algoritma pembelajaran mesin boleh dipecahkan kepada tiga bahagian - ralat bias, kesilapan varians, dan ralat yang tidak dapat ditolak. Bias adalah fenomena yang berlaku dalam model pembelajaran mesin kerana andaian yang salah dalam proses pembelajaran mesin. Bias adalah seperti kesilapan sistematik yang berlaku apabila algoritma menghasilkan hasil yang secara sistematik berat sebelah kerana beberapa andaian yang salah dalam proses pembelajaran mesin. Mereka adalah andaian yang dibuat oleh model untuk menjadikan fungsi sasaran lebih mudah dipelajari.

Bias yang tinggi bermaksud kesilapan dalam latihan serta data ujian lebih besar. Selalu disyorkan bahawa algoritma menjadi berat sebelah rendah untuk mengelakkan masalah yang kurang baik. Katakan anda telah mengambil model yang tidak dapat memperoleh walaupun corak penting daripada set data - ini dipanggil underfitting. Jadi, semata -mata, bias berlaku dalam keadaan di mana anda telah menggunakan algoritma dan ia tidak sesuai dengan betul.

Apa itu varians?

Varians adalah perubahan ketepatan ramalan pembelajaran mesin antara data latihan dan data ujian. Sekiranya variasi dalam dataset membawa perubahan dalam prestasi model, ia dipanggil ralat varians. Ia adalah jumlah yang menganggarkan fungsi sasaran akan berubah jika data latihan yang berbeza digunakan. Fungsi sasaran diandaikan dari data latihan oleh algoritma pembelajaran mesin, jadi beberapa varians dalam algoritma dijangka.

Varians bergantung pada satu set latihan dan ia menentukan ketidakkonsistenan ramalan yang berbeza menggunakan set latihan yang berbeza. Varians yang rendah mencadangkan perubahan kecil kepada anggaran fungsi sasaran dengan perubahan kepada dataset latihan, sementara varians yang tinggi mencadangkan perubahan besar kepada anggaran fungsi sasaran dengan perubahan kepada dataset latihan. Algoritma pembelajaran mesin dengan varians yang tinggi sangat dipengaruhi oleh spesifik data latihan.

Perbezaan antara kecenderungan dan varians

Makna

- Bias adalah fenomena yang berlaku dalam model pembelajaran mesin di mana anda telah menggunakan algoritma dan tidak sesuai dengan betul. Ini bermakna itulah fungsi yang digunakan di sini adalah sedikit kaitan dengan senario dan ia tidak dapat mengekstrak corak yang betul. Varians, sebaliknya, menentukan jumlah variasi yang anggaran fungsi sasaran akan berubah jika data latihan yang berbeza digunakan. Ia mengatakan tentang berapa banyak pemboleh ubah rawak menyimpang dari nilai yang diharapkan.

Senario

- Bias adalah perbezaan antara nilai yang diramalkan dan nilai sebenar. Bias yang rendah mencadangkan kurang andaian mengenai bentuk fungsi sasaran, sementara bias yang tinggi menunjukkan lebih banyak andaian mengenai bentuk fungsi sasaran. Contoh di mana model tidak dapat mencari corak dalam set latihan dipanggil underfitting. Varians adalah apabila model mengambil kira turun naik dalam data. Model ini berfungsi dengan baik pada data ujian dan mendapat ketepatan yang tinggi tetapi gagal melakukan data baru dan tidak kelihatan.

Bias Pembelajaran Mesin vs. Varians: Carta Perbandingan

Bias	Varians
Bias adalah fenomena yang berlaku dalam model pembelajaran mesin di mana algoritma digunakan dan tidak sesuai dengan betul.	Varians Menentukan jumlah variasi yang anggaran fungsi sasaran akan berubah jika data latihan yang berbeza digunakan.
Bias merujuk kepada perbezaan antara nilai yang diramalkan dan nilai sebenar.	Varians mengatakan tentang berapa banyak pemboleh ubah rawak menyimpang dari nilai yang diharapkan.
Model ini tidak dapat mencari corak dalam dataset latihan dan gagal untuk kedua -dua data yang dilihat dan tidak kelihatan.	Model ini menemui kebanyakan corak dalam dataset dan bahkan belajar dari data yang tidak perlu atau bunyi bising.

Ringkasan

Apa sahaja model yang anda miliki, ia harus menjadi keseimbangan sempurna antara kecenderungan dan varians. Matlamat mana -mana algoritma pembelajaran mesin yang diselia adalah untuk mencapai kecenderungan yang rendah dan varians yang rendah. Walau bagaimanapun, senario ini tidak mungkin kerana kedua -duanya bersambung dengan songsang antara satu sama lain dan praktikalnya mustahil untuk mempunyai model pembelajaran mesin dengan kecenderungan yang rendah dan varians yang rendah. Tidak seperti kecenderungan, varians adalah apabila model mengambil kira turun naik dalam data dan bahkan bunyi. Sekiranya anda cuba mengubah algoritma agar lebih sesuai dengan dataset yang diberikan, ia mungkin beralih kepada kecenderungan yang rendah tetapi akan meningkatkan varians.

Apa itu kecenderungan dan varians dengan contoh?

Bias dalam pembelajaran mesin adalah fenomena yang berlaku apabila algoritma digunakan dan tidak sesuai dengan betul. Beberapa contoh kecenderungan termasuk bias pengesahan, kecenderungan kestabilan, dan kecenderungan ketersediaan. Algoritma ML dengan varians yang rendah termasuk regresi linear, regresi logistik, dan analisis diskriminasi linear.

Apakah 3 jenis kecenderungan pembelajaran mesin?

Tiga jenis kecenderungan adalah bias maklumat, kecenderungan pemilihan, dan membingungkan.

Bagaimana pembelajaran mesin dapat mengurangkan kecenderungan dan varians?

Mustahil untuk mempunyai model pembelajaran mesin dengan kecenderungan yang rendah dan varians yang rendah. Untuk meminimumkan kecenderungan dalam pembelajaran mesin, anda boleh memilih model pembelajaran yang betul atau menggunakan dataset latihan yang betul.

Apakah empat jenis kecenderungan dalam pembelajaran mesin?

Empat jenis kecenderungan termasuk pemilihan bias, outlier, bias pengukuran, kecenderungan ingat, dan banyak lagi.