Veri Madenciliği ve Veri Ambarı
“Veri madenciliği” ve “veri ambarı” terimleri veri yönetimi alanı ile ilgilidir. Bunlar, büyük ölçüde veri içindeki istatistikleri, modelleri ve boyutları incelemek ve analiz etmek için kullanılan veri toplama programlarıdır..
Veri madenciliği
“Veri madenciliği” terimi, verilerin çeşitli perspektifler açısından analiz edilmesini ve bu verilerin yararlı bilgiler halinde toplanmasını içeren bir işlem için kullanılır. Veri madenciliği yazılımı, verileri maliyet düşürmede veya gelirde veya her ikisinde de artış sağlamak üzere düzenleyecek şekilde işler..
Veri madenciliği prosedürleri, kullanıcı tarafından üretilen verilere ve sorgulara dayalı olarak belirli eğilimlerin tanımlanmasıyla derinlemesine bir çalışma ve bilgi toplanmasını takip eder. Veri madenciliği yazılımının temel amacı, olağandışı kalıpları tanımlamak, özellikle finansla ilgili sahtekarlıkları tespit etmek ve pazarlamayı geliştirmek için yönlendirilmiş programlar oluşturmaktır.
Veri madenciliği yazılımı esas olarak toplanan büyük miktarda veri nedeniyle kullanılır. Veriler tarayıcılar, doğrudan posta yanıtı, ATM makineleri, Web sunucusu günlükleri, demografik veriler, kapalı devre kameralar, kredi kartı işlemleri ve birçok ek kaynak aracılığıyla aktarılır. Herhangi bir analiz yapılmadan önce tüm bu bilgilerin doğrulanması ve özetlenmesi gerekir. Bu işlem veri ambarı olarak kategorize edilir. Bir sonraki adım, veri madenciliği kapsamında entegre edilen çeşitli prosedürler yoluyla bu bilgileri sıralamaktır.
Veri madenciliği yazılımı çeşitli adımlardan yararlanır. İlk adım aşağıdakileri içeren verilerin önceden işlenmesidir: verilerin seçimi, verilerin temizlenmesi, gürültünün giderilmesi ve verilerin dönüştürülmesi. Bu ortak bilgi birimleri oluşturulduktan sonra yeni alanlar oluşturulur. Bir sonraki adım, bir veri madenciliği modelinin oluşturulmasıdır. Burada, yararlı bilgileri özetlemek için prospektif bir model oluşturulmuştur. Son adım veri madenciliği modelinin değerlendirilmesidir.
Veri madenciliği günümüzde esas olarak iş dünyasında artan rekabet nedeniyle gereklidir. Şirketler hizmetler, kişiselleştirme, güvenlik ve gerçek zamanlı girişim açısından rekabet ediyor.
Veri depolama
Veri depolama, daha sonra veri madenciliği için analiz edilebilecek veri toplama ve depolama işlemidir. Bir veri ambarı, büyük bir depolama kapasitesine sahip ayrıntılı bir bilgisayar sistemidir. Tüm kaynaklardan gelen veriler, çakışan ve gereksiz bilgileri kaldırmak için verilerin temizlendiği bu kaynağa yönlendirilir. Veri ambarı süreci, merkezi veri erişimine olanak tanır.
Ayrıntılı ve karmaşık veri toplama ve işleme teknikleri, kuruluşların etkili ve verimli bir veri depolama tesisi kurmaları için ana kaynaklardır. Bunlar, şirketlerin kârlılıklarını, verimliliklerini ve rekabet avantajlarını korumak için önemli bir varlıktır. Toplanan veriler Veri Yaşam Döngüsü Yönetimi adı verilen bir süreçten geçirilir.
Veri ambarı çıkarma, yükleme, dönüştürme ve ilişkisel çevrimiçi uygulama işleme gibi göreli veri tabanı yönetim sistemleri için tekniklerden yararlanır. Veri ambarı tekniklerinin dört özelliği vardır. Bunlar: konuya dayalı tasarım, verilerle entegrasyon, durumların geçici olmayan görüntüsü, veri ve verinin zaman varyant görünümleri.
Özet: