Sınıflandırma ve tahmin, veri madenciliği ile ilişkili iki terimdir. Veriler neredeyse tüm organizasyon için karı artırmak ve piyasayı anlamak açısından önemlidir. Düz verilerin fazla bir değeri yoktur. Bu nedenle, yararlı bilgi alabilmek için verilerin işlenmesi gerekir. Veri madenciliği, büyük miktarda veriden bilgi alan teknolojidir. Verilerin geniş bir şekilde anlaşılmasına yardımcı olur. Veri madenciliğinin bazı uygulamaları pazar analizi, üretim kontrolü ve sahtekarlık tespitidir. Sınıflandırma ve tahmin, veri madenciliği ile ilişkili iki terimdir. Bu makalede, sınıflandırma ve tahmin arasındaki fark tartışılmaktadır.. Sınıflandırma, ait olduğu yeni gözlemin kategorisini veya sınıf etiketini tanımlama işlemidir. Tahmin, yeni bir gözlem için eksik veya mevcut olmayan sayısal verileri tanımlama işlemidir. İşte arasındaki temel fark sınıflandırma ve tahmin. Tahmin, sınıflandırmada olduğu gibi sınıf etiketi ile ilgili değildir.
1. Genel Bakış ve Temel Fark
2. Sınıflandırma nedir
3. Tahmin Nedir?
4. Sınıflandırma ve Tahmin Arasındaki Benzerlikler
5. Yan Yana Karşılaştırma - Tablo Şeklinde Sınıflandırma ve Tahmin
6. Özet
Sınıflandırma, yeni bir gözlemin kategorisini veya sınıf etiketini tanımlamaktır. İlk olarak, eğitim verisi olarak bir veri kümesi kullanılır. Giriş verisi seti ve karşılık gelen çıkışlar algoritmaya verilir. Bu nedenle, eğitim veri seti giriş verilerini ve ilişkili sınıf etiketlerini içerir. Eğitim veri kümesini kullanarak, algoritma bir model veya sınıflandırıcı türetir. Türetilen model bir karar ağacı, matematiksel formül veya bir sinir ağı olabilir. Sınıflandırmada, etikete etiketlenmemiş bir veri verildiğinde, ait olduğu sınıfı bulması gerekir. Modele sağlanan yeni veriler test veri kümesidir.
Sınıflandırma, bir kaydı sınıflandırma işlemidir. Sınıflandırmanın basit bir örneği yağmur yağıp yağmadığını kontrol etmektir. Cevap ya evet ya da hayır olabilir. Yani, belirli sayıda seçenek var. Bazen sınıflandırmak için ikiden fazla sınıf olabilir. Buna denir çok sınıflı sınıflandırma. Gerçek hayatta, bankanın belirli bir müşteriye kredi vermenin riskli olup olmadığını analiz etmesi gerekir. Bu örnekte, kategorik etiketi bulmak için bir model oluşturulmuştur. Etiketler riskli veya güvenlidir.
Veri analizinin bir başka süreci de tahmindir. Sayısal bir çıktı bulmak için kullanılır. Sınıflandırmada olduğu gibi, eğitim veri seti girdileri ve karşılık gelen sayısal çıktı değerlerini içerir. Eğitim veri kümesine göre, algoritma modeli veya bir yordayıcıyı türetir. Yeni veriler verildiğinde, model sayısal bir çıktı bulmalıdır. Sınıflandırmanın aksine, bu yöntemin sınıf etiketi yoktur. Model sürekli değerli bir işlevi veya sıralı değeri öngörür.
Regresyon genellikle tahmin için kullanılır. Oda sayısı, toplam alan vb. Gerçeklere bağlı olarak bir evin değerini tahmin etmek, tahmin için bir örnektir. Bir şirket, satış sırasında müşteri tarafından harcanan para miktarını bulabilir. Bu aynı zamanda bir tahmin örneğidir.
Sınıflandırma ve Tahmin | |
Sınıflandırma, kategori üyeliği bilinen gözlemleri içeren bir eğitim veri seti temelinde hangi kategoriye, yeni bir gözlemin ait olduğunu belirleme sürecidir.. | Tahmin, yeni bir gözlem için eksik veya mevcut olmayan sayısal verileri tanımlama işlemidir. |
doğruluk | |
Sınıflandırmada doğruluk, sınıf etiketinin doğru bir şekilde bulunmasına bağlıdır. | Tahminlerde doğruluk, belirli bir göstergenin yeni bir veri için öngörülen bir özelliğin değerini ne kadar iyi tahmin edebileceğine bağlıdır.. |
model | |
Kategorik etiketleri bulmak için bir model veya sınıflandırıcı oluşturulur. | Sürekli değerli bir işlevi veya sıralı değeri öngören bir model veya öngörücü oluşturulacaktır. |
Model için benzer kelimeler | |
Sınıflandırmada, model sınıflandırıcı olarak bilinir. | Tahminlerde, model tahminci olarak bilinir. |
Çok büyük bir veri kümesinden anlamlı bilgiler elde etmek, veri madenciliği olarak bilinir. Bu makalede, veri madenciliğinde sınıflandırma ve tahmin gibi iki veri analizi yöntemi tartışılmaktadır. Hız, ölçeklenebilirlik ve sağlamlık, sınıflandırma ve tahmin yöntemlerinde önemli faktörlerdir. Sınıflandırma, ait olduğu yeni gözlemin kategorisini veya sınıf etiketini tanımlama işlemidir. Tahmin, yeni bir gözlem için eksik veya mevcut olmayan sayısal verileri tanımlama işlemidir. Sınıflandırma ve tahmin arasındaki fark budur.
1. Nokta, Öğreticiler. “Veri Madenciliği Sınıflandırması ve Tahmini.”, Öğreticiler Noktası, 8 Ocak 2018. Buradan erişilebilir
2. “İstatistiksel sınıflandırma.” Vikipedi, Wikimedia Foundation, 6 Mart 2018. Buradan ulaşılabilir
1.'2729773 'GDJ (Kamusal Alan) · Pixabay'de ücretsiz