2022'de Bilmeniz Gereken 6 Denetimli Öğrenme Türü

Yayınlanan: 2021-01-10

Makine öğrenimi, Yapay Zekanın en yaygın uygulamalarından biridir. Bir makine, içinde beslenen verilerden görevleri yürütmeyi öğrenir. Ve deneyimle, belirli bir görevdeki performansı artar. Makine öğrenimi, denetimli, denetimsiz ve güçlendirilmiş öğrenme tekniklerini içerir. Makine öğrenimi türleri hakkında daha fazla bilgi edinin.

Bu yazıda, farklı denetimli öğrenme türlerine bakacağız .

İçindekiler

Denetimli Öğrenme nedir?

Denetimli Öğrenmede, bir makine 'etiketlenmiş' veriler kullanılarak eğitilir. Veri kümelerinin hem girdi hem de çıktı parametreleri içerdiğinde etiketlendiği söylenir. Başka bir deyişle, veriler zaten doğru cevapla etiketlenmiştir.

Bu nedenle, teknik, bir öğrencinin bir süpervizör veya öğretmenin varlığında öğrendiği bir sınıf ortamını taklit eder. Öte yandan, denetimsiz öğrenme algoritmaları, modellerin bilgileri keşfetmesine ve kendi başlarına öğrenmesine izin verir.

Denetimli makine öğrenimi, gerçek dünyadaki hesaplama problemlerini çözmede son derece yararlıdır. Algoritma, etiketlenmiş eğitim verilerinden öğrenerek öngörülemeyen veriler için sonuçları tahmin eder. Bu nedenle, bu tür modelleri oluşturmak ve dağıtmak için yüksek vasıflı veri bilimcileri gerekir. Zamanla, veri bilimcileri, verilen içgörülerin bütünlüğünü korumak için modelleri yeniden oluşturmak için teknik uzmanlıklarını da kullanır.

O nasıl çalışır?

Örneğin, ofisiniz ve eviniz arasındaki işe gidip gelme sürenizi tahmin etmek için bir makineyi eğitmek istiyorsunuz. İlk olarak, giriş verilerinizi oluşturacak hava durumu, günün saati, seçilen rota vb. gibi etiketli bir veri seti oluşturacaksınız. Ve çıktı, belirli bir günde eve dönüş yolculuğunuzun tahmini süresi olacaktır.

Karşılık gelen faktörlere dayalı bir eğitim seti oluşturduğunuzda, makine veri noktaları arasındaki ilişkileri görecek ve eve geri dönmeniz için gereken süreyi belirlemek için bunu kullanacaktır. Örneğin, bir mobil uygulama, yoğun yağış olduğunda seyahat sürenizin daha uzun olacağını söyleyebilir.

Makine, etiketli verilerinizde, işten ayrıldığınız saat gibi başka bağlantılar da görebilir. Yoğun trafiğin yollara çıkmasından önce yola çıkarsanız eve daha erken ulaşabilirsiniz. Denetimsiz makine öğreniminin nasıl çalıştığını merak ediyorsanız daha fazlasını okuyun.

Şimdi, başka bir gerçek yaşam örneğinin yardımıyla denetimli öğrenmeyi anlamaya çalışalım. Diyelim ki bir meyve sepetiniz var ve makineyi her çeşit meyveyle eğitiyorsunuz. Eğitim verileri şu senaryoları içerebilir:

Nesne kırmızı renkliyse, yuvarlak şekilliyse ve tepesinde bir çöküntü varsa, onu 'Elma' olarak etiketleyin.
Öğe yeşilimsi sarı bir renge sahipse ve kavisli bir silindir şeklindeyse, 'Muz' olarak işaretleyin.

Ardından, yeni bir nesne (test verileri) verirsiniz ve makineden bunun bir muz mu yoksa bir elma mı olduğunu belirlemesini istersiniz. Eğitim verilerinden öğrenecek ve bilgileri girilen renk ve şekillere göre meyveleri sınıflandırmak için uygulayacaktır.

Denetimli Öğrenmenin Farklı Türleri

1. Regresyon

Regresyonda, eğitim verileri kullanılarak tek bir çıktı değeri üretilir. Bu değer, girdi değişkenleri arasındaki korelasyonun gücü dikkate alındıktan sonra elde edilen olasılıksal bir yorumdur. Örneğin, regresyon, bir evin fiyatının bulunduğu yere, büyüklüğüne vb. dayalı olarak tahmin edilmesine yardımcı olabilir.

Lojistik regresyonda çıktı, bir dizi bağımsız değişkene dayalı ayrı değerlere sahiptir. Bu yöntem, doğrusal olmayan ve çoklu karar sınırları ile uğraşırken bocalayabilir. Ayrıca, veri kümelerindeki karmaşık ilişkileri yakalamak için yeterince esnek değildir.

2. Sınıflandırma

Verileri sınıflara ayırmayı içerir. Bir kişiye kredi vermeyi düşünüyorsanız, bir kişinin temerrüde düşüp düşmeyeceğini belirlemek için sınıflandırmayı kullanabilirsiniz. Denetimli öğrenme algoritması giriş verilerini iki ayrı sınıfa etiketlediğinde buna ikili sınıflandırma denir. Çoklu sınıflandırma, verileri ikiden fazla sınıfa ayırmak anlamına gelir.

3. Naif Bayes Modeli

Bayes sınıflandırma modeli, büyük sonlu veri kümeleri için kullanılır. Doğrudan bir döngüsel olmayan grafik kullanarak sınıf etiketleri atama yöntemidir. Grafik, bir ana düğüm ve birden çok alt düğüm içerir. Ve her alt düğümün ebeveynden bağımsız ve ayrı olduğu varsayılır.

Karar ağaçları

Karar ağacı, kararları ve bunların olası sonuçlarını içeren koşullu kontrol ifadelerini içeren akış şeması benzeri bir modeldir. Çıktı, öngörülemeyen verilerin etiketlenmesiyle ilgilidir.

Ağaç gösteriminde, yaprak düğümler sınıf etiketlerine karşılık gelir ve iç düğümler öznitelikleri temsil eder. Bir karar ağacı, boole fonksiyonlarının yanı sıra ayrık niteliklere sahip problemleri çözmek için kullanılabilir. Dikkate değer karar ağacı algoritmalarından bazıları ID3 ve CART'tır.

4. Rastgele Orman Modeli

Rastgele orman modeli bir topluluk yöntemidir. Çok sayıda karar ağacı oluşturarak çalışır ve bireysel ağaçların bir sınıflandırmasını verir. Hangi lisans öğrencilerinin lisansüstü yönetim programlarına kabul için girilen bir sınav olan GMAT'ta iyi performans göstereceğini tahmin etmek istediğinizi varsayalım. Daha önce testi almış bir grup öğrencinin demografik ve eğitimsel faktörleri göz önüne alındığında, rastgele bir orman modeli görevi yerine getirecektir.

5. Sinir Ağları

Bu algoritma, ham girdiyi kümelemek, kalıpları tanımak veya duyusal verileri yorumlamak için tasarlanmıştır. Çoklu avantajlarına rağmen, sinir ağları önemli hesaplama kaynakları gerektirir. Binlerce gözlem olduğunda bir sinir ağına sığdırmak karmaşıklaşabilir. Tahminlerinin ardındaki mantığı yorumlamak zor olabileceğinden, buna 'kara kutu' algoritması da denir.

Okuyun : 2020'de En İyi 10 Sinir Ağı Mimarisi

6. Destek Vektör Makineleri

Destek Vektör Makinesi (SVM), 1990 yılında geliştirilen denetimli bir öğrenme algoritmasıdır. Vap Nick tarafından geliştirilen istatistiksel öğrenme teorisinden yararlanır.

SVM, hiper düzlemleri ayırır, bu da onu ayırt edici bir sınıflandırıcı yapar. Çıktı, yeni örnekleri kategorize eden optimal bir hiperdüzlem biçiminde üretilir. SVM'ler çekirdek çerçevesine yakından bağlıdır ve çeşitli alanlarda kullanılır. Bazı örnekler biyoinformatik, örüntü tanıma ve multimedya bilgi alımını içerir.

Denetimli Öğrenmenin Artıları ve Eksileri

Çeşitli denetimli öğrenme türleri, önceki deneyimlerden veri toplamanıza ve üretmenize olanak tanır. Performans kriterlerini optimize etmekten gerçek dünyadaki problemlerle başa çıkmaya kadar, denetimli öğrenme yapay zeka alanında güçlü bir araç olarak ortaya çıkmıştır. Ayrıca, bazı durumlarda hesaplama açısından karmaşık ve daha az doğru olabilen denetimsiz öğrenmeye kıyasla daha güvenilir bir yöntemdir.

Ancak, denetimli öğrenmenin sınırlamaları yoktur. Eğitim sınıflandırıcıları için somut örnekler gereklidir ve doğru örneklerin yokluğunda karar sınırları fazla eğitilebilir. Büyük verilerin sınıflandırılmasında da zorluklarla karşılaşılabilir.

Özetliyor

Denetimli öğrenmenin uzun ve kısa yanı, bir makineyi eğitmek için etiketlenmiş verileri kullanmasıdır. Regresyon teknikleri ve sınıflandırma algoritmaları, son derece güvenilir ve birden fazla uygulamaya sahip tahmine dayalı modeller geliştirmeye yardımcı olur.

Denetimli öğrenme, uzmanların modeller oluşturmasını, ölçeklendirmesini ve güncellemesini gerektirir. Teknik yeterliliğin yokluğunda, girdi değişkenlerini belirlemek için kaba kuvvet uygulanabilir. Ve bu yanlış sonuçlar verebilir. Bu nedenle, denetimli öğrenmenin etkili bir şekilde çalışması için ilgili veri özelliklerinin seçimi çok önemlidir.

Önce eğitim seti için hangi verilerin gerekli olduğuna karar vermeli, öğrenilen işlevi ve algoritmayı yapılandırmaya devam etmeli ve ayrıca uzmanlardan ve ölçümlerden elde edilen sonuçları bir araya getirmelidir. Bu tür en iyi uygulamalar, bir modelin doğruluğunu desteklemede uzun bir yol kat edebilir.

Yapay zeka ve makine öğrenimi günümüzün teknoloji odaklı dünyasında hız kazanırken , denetimli öğrenme türleri hakkında bilgi sahibi olmak her alanda önemli bir farklılaştırıcı olabilir. Yukarıdaki açıklamalar, bu ilk adımı atmanıza yardımcı olacaktır!

Makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 450+ saat zorlu eğitim, 30'dan fazla vaka çalışması ve ödev, IIIT- sunan IIIT-B & upGrad'ın Makine Öğrenimi ve Yapay Zeka PG Diplomasına göz atın. B Mezun statüsü, 5'ten fazla pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.

Dünyanın En İyi Üniversitelerinden ML Kursu öğrenin . Kariyerinizi hızlandırmak için Master, Executive PGP veya Advanced Certificate Programları kazanın.

Denetimli öğrenmenin anlamı nedir?

Bir makine, Denetimli Öğrenmede 'etiketli' verileri kullanarak öğrenir. Bir veri kümesi hem giriş hem de çıkış parametrelerine sahip olduğunda, etiketli olduğu kabul edilir. Başka bir deyişle, bilgi zaten doğru yanıtla etiketlenmiştir. Gerçek dünyadaki hesaplama zorluklarında, denetimli makine öğrenimi oldukça faydalıdır. Sistem, beklenmeyen veriler için sonuçları tahmin etmek için etiketlenmiş eğitim verilerinden öğrenir. Sonuç olarak, bu tür modelleri oluşturmak ve dağıtmak, çok yetenekli veri bilimcilerinin uzmanlığını gerektirir. Veri bilimcileri, sağlanan içgörülerin geçerliliğini korumak için teknik bilgilerini zaman içinde modeller oluşturmak için kullanır.

Sınıflandırma ve regresyon arasındaki fark nedir?

Eğitim verilerini kullanarak, regresyon tek bir çıktı değeri üretir. Bu, girdi değişkenleri arasındaki korelasyonun gücü dikkate alınarak belirlenen olasılıksal bir yorumdur. Örneğin, regresyon, bir evin fiyatının konumuna, büyüklüğüne ve diğer faktörlere göre tahmin edilmesine yardımcı olabilir. Verileri sınıflandırma eylemi, onu kategorilere ayırmayı gerektirir. Bir kişiye kredi vermeyi düşünüyorsanız, bir kişinin temerrüde düşüp düşmeyeceğini değerlendirmek için kategorizasyonu kullanabilirsiniz. İkili sınıflandırma, denetimli bir öğrenme algoritması giriş verilerini iki ayrı sınıfa sınıflandırdığında oluşur. Çoklu sınıflandırma, bilginin ikiden fazla gruba bölünmesini ifade eder.

Rastgele orman nedir?

Bir topluluk yöntemi, rastgele orman modelidir. Çok sayıda karar ağacı oluşturarak ve ardından tek tek ağaçları sınıflandırarak çalışır. Lisansüstü yönetim programlarına giriş için gerekli bir sınav olan GMAT'ta hangi üniversite öğrencilerinin başarılı olacağını bilmek istediğinizi varsayalım. Testi daha önce almış bir grup öğrencinin demografik ve eğitimsel özellikleri göz önüne alındığında, rastgele bir orman modeli görevi tamamlayabilir.