Derin ve pekiştirici öğrenme, yapay zekanın (AI) hesaplama gücü ile büyük ölçüde ilişkilidir. Bunlar, bilgisayarların çözüm üretirken kendi ilkelerini yaratmalarını sağlayan özerk makine öğrenme işlevleridir. Bu iki tür öğrenme de çeşitli programlarda bir arada bulunabilir. Genel olarak, derin öğrenme mevcut verileri kullanır, takviye öğrenme ise tahminleri anlamada deneme yanılma yöntemini kullanır. Aşağıdaki tartışmalar bu ayrımları daha da derinlemesine incelemektedir.
Derin öğrenme aynı zamanda derin yapılandırılmış öğrenme veya hiyerarşik öğrenme olarak da adlandırılır. Bu ilk olarak 1986'da bilgisayar bilimi profesörü Rina Dechter tarafından tanıtıldı. Verilerin öngörülmesinde önemli olan ilgili kalıpları aramak için algoritmalardaki güncel bilgileri kullanır. Bu sistem, insan beyninin nöronal yapısına benzer farklı seviyelerde yapay sinir ağları kullanır. Karmaşık bağlantıların yardımıyla, algoritma milyonlarca bilgiyi ve bölgeyi daha spesifik bir tahminle işleyebilir.
Bu tür öğrenme, geliştiriciler çeşitli resimlerdeki renkli menekşeyi tespit etmek için bir yazılım istediklerinde uygulanabilir. Program daha sonra menekşe renkleri olan ve olmayan bir dizi görüntü (dolayısıyla “derin” öğrenme) ile beslenecektir. Kümeleme yoluyla, program desenleri tanımlayabilecek ve bir rengin ne zaman mor olarak işaretleneceğini öğrenebilecektir. Derin öğrenme, görüntü analizleri ve zaman serisi tahminleri gibi tahmin görevleri gibi çeşitli tanıma programlarında kullanılır.
Takviye öğrenimi genellikle deneme yanılma yoluyla tahminleri çözer. AI açısından tarihi ile ilgili olarak, 1980'lerin sonunda geliştirilmiştir; hayvan deneylerinin sonuçlarına, optimal kontrol kavramlarına ve zamansal fark yöntemlerine dayanıyordu. Denetimli ve denetimsiz öğrenmenin yanı sıra pekiştirme, makine öğreniminin temel paradigmalarından biridir. Adından da anlaşılacağı gibi, algoritma ödüllerle eğitilir.
Örneğin, AI belirli bir mobil oyunda insanlarla oynamak için geliştirilmiştir. Yapay zeka her kaybettiğinde, algoritma puanını en üst düzeye çıkarmak için revize edilir. Böylece, bu tür bir teknik hatalarından öğrenir. Çok sayıda döngüden sonra, AI gelişti ve insan oyuncuları yenmede daha iyi hale geldi. Takviye öğrenimi, robotik, metin madenciliği ve sağlık bakımı gibi çeşitli ileri teknolojilerde uygulanır.
Derin öğrenme, mevcut verileri analiz ederek ve öğrenilenleri yeni bir bilgi kümesine uygulayarak hedef davranışı yürütebilir. Öte yandan, pekiştirici öğrenme sürekli geribildirimi adapte ederek yanıtını değiştirebilir.
Derin öğrenme algoritma eğitiminde zorunlu olduğu için zaten var olan verilerle çalışır. Takviye öğrenmeye gelince, doğada keşif niteliğindedir ve deneme yanılma yoluyla öğrendiği için mevcut bir veri seti olmadan geliştirilebilir.
Derin öğrenme görüntü ve konuşma tanıma, derin ağ ön eğitim ve boyut küçültme görevlerinde kullanılır. Buna karşılık, güçlendirici öğrenme, robotlar, asansör çizelgeleme, telekomünikasyon, bilgisayar oyunları ve sağlık bakımı yapay zekası gibi optimal kontrol ile dış uyaranlarla etkileşimde kullanılır..
Derin öğrenme, hiyerarşik öğrenme veya derin yapılandırılmış öğrenme olarak da bilinir, pekiştirici öğrenmenin başka yaygın olarak bilinen terimleri yoktur.
Derin öğrenme çok sayıda makine öğrenme yönteminden biridir. Diğer yandan, pekiştirici öğrenme makine öğreniminin bir alanıdır; üç temel paradigmadan biri.
Derin öğrenmeye kıyasla, takviye öğrenimi insan beyninin yeteneklerine daha yakındır, çünkü bu tür bir zeka geri bildirim yoluyla geliştirilebilir. Derin öğrenme temel olarak tanıma içindir ve etkileşim ile daha az bağlantılıdır.
Derin öğrenme ilk olarak 1986 yılında Rina Dechter tarafından tanıtıldı. 1980'lerin sonunda hayvan deneyleri, optimal kontrol ve zamansal fark yöntemleri kavramlarına dayanarak takviye öğrenimi geliştirildi..