Veri Madenciliği ve OLAP
Hem veri madenciliği hem de OLAP, yaygın İş Zekası (BI) teknolojilerinden ikisidir. İş zekası, iş verilerinden yararlı bilgileri tanımlamak ve çıkarmak için bilgisayar tabanlı yöntemlere atıfta bulunur. Veri madenciliği, büyük veri kümelerinden ilginç kalıpların çıkarılmasıyla ilgilenen bilgisayar bilimi alanıdır. Yapay zeka, istatistik ve veritabanı yönetiminden birçok yöntemi birleştirir. OLAP (çevrimiçi analitik işleme) adından da anlaşılacağı gibi, çok boyutlu veritabanlarını sorgulamanın yollarının bir derlemesidir.
Veri madenciliği aynı zamanda verilerde Bilgi Keşfi (KDD) olarak da bilinir. Yukarıda belirtildiği gibi, ham verilerden daha önce bilinmeyen ve ilginç bilgilerin çıkarılmasıyla ilgilenen bir bilgisayar bilimi alanıdır. Özellikle iş gibi alanlarda verilerin katlanarak büyümesi nedeniyle, veri madenciliği bu büyük veri zenginliğini iş zekasına dönüştürmek için çok önemli bir araç haline gelmiştir, çünkü kalıpların elle çıkarılması son yıllarda imkansız görünmektedir. Örneğin, şu anda sosyal ağ analizi, sahtekarlık tespiti ve pazarlama gibi çeşitli uygulamalar için kullanılmaktadır. Veri madenciliği genellikle şu dört görevle ilgilidir: kümeleme, sınıflandırma, regresyon ve ilişkilendirme. Kümeleme, yapılandırılmamış verilerden benzer grupları tanımlamaktadır. Sınıflandırma, yeni verilere uygulanabilecek öğrenme kurallarıdır ve tipik olarak aşağıdaki adımları içerir: verilerin ön işlenmesi, modelleme tasarımı, öğrenme / özellik seçimi ve değerlendirme / onaylama. Regresyon, verileri modellemek için minimum hata içeren işlevler bulmaktır. Ve ilişki değişkenler arasındaki ilişkileri arıyor. Veri madenciliği genellikle Wal-Mart'ta yüksek kâr elde etmenize yardımcı olabilecek ana ürünler neler gibi soruları cevaplamak için kullanılır.
OLAP, çok boyutlu sorgulara cevaplar sağlayan bir sistem sınıfıdır. OLAP genellikle pazarlama, bütçeleme, tahmin ve benzeri uygulamalar için kullanılır. OLAP için kullanılan veritabanlarının, hızlı bir performans göz önünde bulundurularak karmaşık ve geçici sorgular için yapılandırıldığını söylemeye gerek yok. Tipik olarak bir OLAP çıktısını görüntülemek için bir matris kullanılır. Satırlar ve sütunlar, sorgunun boyutları ile oluşturulur. Özet almak için genellikle birden çok tabloda toplama yöntemlerini kullanırlar. Örneğin, Wal-Mart'ta bu yılın satışlarını geçen yıla göre bulmak için kullanılabilir mi? Önümüzdeki çeyrekte satışların tahmini nedir? Yüzde değişimine bakarak trend hakkında ne söylenebilir??
Veri madenciliği ve OLAP'ın benzer olduğu açık olsa da, zeka kazanmak için veriler üzerinde çalıştıklarından, temel fark, veriler üzerinde nasıl çalıştıklarından kaynaklanmaktadır. OLAP araçları çok boyutlu veri analizi sağlar ve verilerin özeti sağlar, ancak aksine, veri madenciliği veri kümesindeki oranlara, örüntülere ve etkilere odaklanır. Bu, toplama ile ilgili bir OLAP anlaşmasıdır, bu da “toplama” yoluyla verilerin işleyişine bağlanır, ancak veri madenciliği “bölünmeye” karşılık gelir. Diğer önemli fark, veri madenciliği araçları verileri modellerken ve eyleme dönüştürülebilir kuralları döndürürken, OLAP'ın gerçek boyutta işletme boyutu boyunca karşılaştırma ve kontrast teknikleri uygulayacağıdır..