Veri madenciliği ve Veri Ambarı
Veri Madenciliği ve Veri Ambarı, verileri analiz etmek için hem çok güçlü hem de popüler tekniklerdir. İstatistiklere yönelmiş kullanıcılar Veri Madenciliği kullanır. Verilerdeki gizli kalıpları aramak için istatistiksel modeller kullanırlar. Veri madencileri, nihayetinde işletmeler için karlı olan farklı veri öğeleri arasında faydalı ilişkiler bulmakla ilgileniyor. Ancak öte yandan, işletmenin boyutlarını analiz edebilen veri uzmanları doğrudan Veri ambarlarını kullanma eğilimindedir.
Veri madenciliği aynı zamanda verilerde Bilgi Keşfi (KDD) olarak da bilinir. Yukarıda belirtildiği gibi, ham verilerden daha önce bilinmeyen ve ilginç bilgilerin çıkarılmasıyla ilgilenen bir bilgisayar bilimi alanıdır. Özellikle iş gibi alanlarda verilerin katlanarak büyümesi nedeniyle, veri madenciliği bu büyük veri zenginliğini iş zekasına dönüştürmek için çok önemli bir araç haline gelmiştir, çünkü kalıpların elle çıkarılması son yıllarda imkansız görünmektedir. Örneğin, şu anda sosyal ağ analizi, sahtekarlık tespiti ve pazarlama gibi çeşitli uygulamalar için kullanılmaktadır. Veri madenciliği genellikle şu dört görevle ilgilidir: kümeleme, sınıflandırma, regresyon ve ilişkilendirme. Kümeleme, yapılandırılmamış verilerden benzer grupları tanımlamaktadır. Sınıflandırma, yeni verilere uygulanabilecek öğrenme kurallarıdır ve tipik olarak aşağıdaki adımları içerir: verilerin önişlenmesi, modelleme tasarımı, öğrenme / özellik seçimi ve Değerlendirme / onaylama. Regresyon, verileri modellemek için minimum hata içeren işlevler bulmaktır. Ve ilişki değişkenler arasındaki ilişkileri arıyor. Veri madenciliği genellikle Wal-Mart'ta yüksek kâr elde etmenize yardımcı olabilecek ana ürünler neler gibi soruları cevaplamak için kullanılır?
Yukarıda belirtildiği gibi, Veri ambarı da verileri analiz etmek için kullanılır, ancak farklı kullanıcı grupları ve biraz farklı bir amaç göz önünde bulundurulur. Örneğin, perakende sektörü söz konusu olduğunda, Veri ambarı kullanıcıları müşteriler arasında ne tür satın alımların popüler olduğu konusunda daha fazla endişe duymaktadır, bu nedenle analiz sonuçları müşteri deneyimini geliştirerek müşteriye yardımcı olabilir. Ancak Veri madencileri ilk önce müşterilerin belirli bir ürün türünü satın aldıkları ve hipotezi test etmek için verileri analiz ettikleri gibi bir hipotez tasarlar. Veri ambarı, daha sonra New York mağazalarının daha küçük boyutlu envanterleri Chicago mağazalarından daha hızlı sattığını öğrenmek için mağazalarını başlangıçta aynı boyutlarda ürünlerle stoklayan büyük bir perakendeci tarafından gerçekleştirilebilir. Bu nedenle, perakendeci New York mağazasını Chicago mağazalarına kıyasla daha küçük boyutlarda stoklayabilir.
Dolayısıyla, açıkça görebileceğiniz gibi, bu iki analiz türü çıplak gözle aynı niteliktedir. Her ikisi de tarihsel verilere dayanarak kârı arttırmakla ilgileniyor. Ama elbette, önemli farklılıklar var. Basit bir ifadeyle, Veri Madenciliği ve Veri Ambarı, farklı türde analitikler sunmaya adanmıştır, ancak kesinlikle farklı kullanıcı türleri için. Başka bir deyişle, Veri Madenciliği korelasyonları arar, istatistiksel bir hipotezi desteklemek için patterler. Ancak, Veri Ambarı nispeten daha geniş bir soruyu cevaplar ve gelecekte iyileştirme yollarını tanımak için verileri oradan dilimler ve dices.