Rastgele Ormanlar Sizi Karar Ağaçlarından Nasıl Korur
Bir Ağacın yaşam döngüsü tohum olarak başlar. Tohumlar büyür ve genç fidan halini alır. Genç fidanlar yıllar içerisinde ağaçlara dönüşeceklerdir. Tekil ağaçlarda bir araya gelerek bulundukları bölgeyi ormana dönüştürürler. Devasa ormanlar bile en başında tek bir tohumdan türerler. Kural bazlı sistemler de buna benzer adımları izlemektedir.
Bu yaşam döngüsünde veriyi tohum evresi olarak düşünebilirsiniz. Verinin büyümesi bir veri setini oluşturur ve bu da fidan halidir. Karar ağacı algoritmaları veri setlerini kural bazlı ağaçlara dönüştürürler. Diğer bir deyişle karar ağacı algoritmasının veri setine uygulanması da ağaç halini simgeler.
Bu noktada rastgele ormanlar, karar ağaçlarından evrilmiş yeni bir algoritmadır. Karar ağacı algoritmasını tüm veri seti üzerine uygulamak yerine veri öncelikli olarak daha ufak alt kümelere bölünür ve aynı karar ağacı algoritmaları bu alt kümelere uygulanır. Karar da en yüksek oranlı alt küme sonuçlarına göre verilir.
Karar Ağaçları İyidir, Rastgele Ormanlar İse Daha İyi
Peki karar ağacı algoritmaları neden rastgele ormanlar olarak adlandırılan yeni bir hale evrildi? Büyük bir veri seti üzerinde çalışma aşırı uyum gösterme (overfitting) problemine sebep olabilir. Başka bir deyişle, öğrenme yerine ezberleme durumu ile karşılaşılabilir. Bu durumda eğitim setiniz üzerinde çok yüksek başarılar elde ederken yeni örneklemler üzerine hataya düşebilirsiniz.
Daha fazlası, rastgele ormanlar çoklu küçük veri setleri üzerinde çalışırlar. Karar ağacı algoritmalarında veri setinin büyümesi öğrenme süresinin eksponensiyel olarak artmasına neden olmaktadır. Rastgele ormanlarda ise öğrenme prosedürü paralelleştirilebilmektedir. Dolayısıyla öğrenme süreleri karar ağaçlarından daha kısa sürmektedir.
Karar ağacı algoritmasını çevrenizdeki bilge bir insan olarak düşünebilirsiniz. Rastgele ormanlar algoritmasını ise çevrenizdeki bilge değil ama bir kaç zeki insan olacaktır. Bilge olan kişi her iş alanında uzman olabilirken zeki insanlar da farklı iş kollarında ayrı ayrı uzmanlığa sahip olabilirler. Bilge kişi sorunuza büyük ihtimalle doğru yanıt verecektir fakat çevrenizde her zaman bilge bir kişi olmayabilir. Fakat, zeki kişileri bir araya toplamak her zaman daha makuldür.
Voltran çizgi filmini izleyenleriniz varsa anımsayacaktır. 5 farklı aslan robotu bireysel olarak savaşma yeteneğine sahipken bir araya gelerek Voltran olarak adlandırılan dev bir robotu da oluşturabilmektedir. Her bölümde bireysel olarak savaşmayı deneseler de nihayetinde Voltran’ı oluşturarak düşmanı yenerlerdi. Rastgele ormanlar, adeta bir araya gelerek Voltran’ı oluşturan bireysel robotlardır.
Anlayacağınız üzere Güneşin altında yeni bir şey yok…
Bu yazı Yazılımcının Seyir Defteri blogundaki How Random Forests Can Keep You From Decision Tree yazısından Türkçe’ye çevrilmiştir.