Torbalama ve Rastgele Orman Arasındaki Fark

Yıllar içinde, topluluk sistemleri olarak da adlandırılan çoklu sınıflandırma sistemleri popüler bir araştırma konusu olmuştur ve hesaplama zekası ve makine öğrenimi topluluğunda artan ilgi görmüştür. Makine Öğrenimi, İstatistikler, Örüntü Tanıma ve Veritabanlarında Bilgi Keşfi gibi çeşitli alanlardan bilim adamlarının ilgisini çekti. Zamanla, topluluk yöntemleri, geniş bir yelpazedeki sorun alanları ve gerçek dünya uygulamalarında çok etkili ve çok yönlü olduklarını kanıtlamıştır. Başlangıçta otomatik karar verme sistemindeki varyansı azaltmak için geliştirilen topluluk yöntemleri, çeşitli makine öğrenimi sorunlarını ele almak için kullanılmıştır. En önemli iki topluluk algoritmasına (Torbalama ve Rastgele Orman) bir genel bakış sunuyoruz ve daha sonra ikisi arasındaki farkları tartışıyoruz..

Çoğu durumda, bootstrap örneklemesi kullanan torbalamanın, sınıflandırma geriliminin, tek bir sınıflandırma ağacından daha yüksek doğrulukta olduğu gösterilmiştir. Torbalama, tahminlerin doğruluğunu artırmak için ağaç tabanlı algoritmalara uygulanabilen en eski ve en basit topluluk tabanlı algoritmalardan biridir. Aslında bir torbalama mekanizması ile eğitilmiş karar ağaçlarının bir topluluğu olan Rastgele Orman algoritması adı verilen torbalamanın başka bir geliştirilmiş versiyonu var. Rastgele orman algoritmasının nasıl çalıştığını ve topluluk modellerinde torbalamadan nasıl farklı olduğunu görelim.

sarkık

Torbalama olarak da bilinen Bootstrap kümelenmesi, karar ağaçlarını daha sağlam hale getirmek ve daha iyi performans elde etmek için en eski ve en basit topluluk tabanlı algoritmalardan biridir. Torbalamanın arkasındaki konsept, daha temel bir çıktı elde etmek için birkaç temel öğrenenin tahminlerini birleştirmektir. Leo Breiman, 1994 yılında torbalama algoritmasını tanıttı. Bootstrap kümelenmesinin, eğitim verilerindeki küçük değişikliklerin tahminlerde büyük değişikliklere neden olabileceği kararsız öğrenme algoritmalarında istenen sonuçları getirebileceğini gösterdi. Önyükleme, değiştirilmiş bir veri kümesinin bir örneğidir ve her örnek, m örnekli yeni bir küme elde edilene kadar m boyutlu eğitim setini eşit olarak örnekleyerek oluşturulur..

Rastgele Orman

Rastgele orman, topluluk öğrenmesine ve Breiman'ın orijinal torbalama algoritmasının evrimine dayanan denetimli bir makine öğrenme algoritmasıdır. Birden fazla karar ağacı oluşturmak ve bunları doğru bir sonuç elde etmek için toplamak için torbalanmış karar ağaçlarına göre büyük bir gelişme. Breiman, torbalama prosedürüne rastgele bir varyasyon ekledi ve sonuçta ortaya çıkan modeller arasında daha fazla çeşitlilik yarattı. Rastgele ormanlar, ağaçların büyüme aşamasında bölünmesi için mevcut tahmin edicilerinin yalnızca bir alt kümesini kullanmaya zorlayarak torbalanmış ağaçlardan farklıdır. Rastgele bir orman oluşturan tüm karar ağaçları farklıdır, çünkü her ağaç farklı bir rastgele veri alt kümesi üzerine inşa edilmiştir. Aşırı takmayı en aza indirdiği için, tek bir karar ağacından daha doğru olma eğilimindedir..

Torbalama ve Rastgele Orman Arasındaki Fark

temeller

- Hem torbalama hem de rastgele ormanlar, eğitim verilerinin üzerine düşen modellerin karmaşıklığını azaltmayı amaçlayan topluluk tabanlı algoritmalardır. Torbalama olarak da adlandırılan bootstrap toplama, aşırı sığmayı önlemek için en eski ve güçlü topluluk yöntemlerinden biridir. Tahmin doğruluğunu artırmak için birden fazla sınıflandırıcı kullanan bir meta-tekniktir. Torbalama, farklı modellerden oluşan bir topluluk elde etmek için değiştirme için eğitim numunesinden rastgele numuneler çıkarmak anlamına gelir. Rastgele orman, topluluk öğrenmesine ve Breiman'ın orijinal torbalama algoritmasının evrimine dayanan denetimli bir makine öğrenme algoritmasıdır.

kavram

- Bootstrap örneklemesi (torbalama) kavramı, karar ağaçlarının varyansını azaltmak için eğitim verilerinin farklı rastgele alt kümeleri üzerinde, bir dizi eşi görülmemiş karar ağacı yetiştirmektir. Fikir, daha doğru bir çıktı oluşturmak için çeşitli temel öğrencilerin tahminlerini birleştirmektir. Rastgele ormanlarda, ortaya çıkan modeller arasında daha fazla çeşitlilik yaratmak için torbalama prosedürüne ek bir rastgele varyasyon eklenir. Rastgele ormanların ardındaki fikir, birden çok karar ağacı oluşturmak ve doğru sonuç almak için onları bir araya getirmektir..

Hedef

- Hem torbalı ağaçlar hem de rastgele ormanlar, çeşitli makine öğrenimi sorunlarını ele almak için kullanılan en yaygın topluluk öğrenme araçlarıdır. Bootstrap örneklemesi, topluluk öğrenimi kullanarak makine öğrenme modellerinin doğruluğunu ve kararlılığını artırmak ve aşırı uyum modellerinin karmaşıklığını azaltmak için tasarlanmış bir meta-algoritmadır. Rastgele orman algoritması aşırı sığmaya karşı çok sağlamdır ve dengesiz ve eksik verilerle iyidir. Ayrıca tahmin modelleri oluşturmak için tercih edilen algoritma seçimidir. Amaç, verilerin farklı örnekleri üzerinde eğitilmiş çok sayıda derin karar ağacının ortalamasını alarak varyansı azaltmaktır.

Torbalama ve Rastgele Orman: Karşılaştırma Tablosu

özet

Hem torbalı ağaçlar hem de rastgele ormanlar, çeşitli makine öğrenimi sorunlarını ele almak için kullanılan en yaygın topluluk öğrenme araçlarıdır. Torbalama, tahminlerin doğruluğunu artırmak için ağaç tabanlı algoritmalara uygulanabilen en eski ve en basit topluluk tabanlı algoritmalardan biridir. Random Forests ise denetimli bir makine öğrenme algoritması ve hem regresyon hem de sınıflandırma problemleri için kullanılan bootstrap örnekleme modelinin geliştirilmiş bir versiyonudur. Rastgele ormanın ardındaki fikir, birden çok karar ağacı oluşturmak ve doğru sonuç almak için onları bir araya getirmektir. Rasgele bir orman, tek bir karar ağacından daha doğru olma eğilimindedir, çünkü aşırı sığmayı en aza indirir.