Siyam Ağı ile Tek Adımda Öğrenme [Yüz Tanıma İçin]
Yayınlanan: 2021-02-08Aşağıdaki makale, Varyasyonları ve dezavantajları ile birlikte Tek seferde öğrenmeyi kullanma ihtiyacından bahseder.
Başlangıç olarak, herhangi bir derin öğrenme modelini eğitmek için, modelimizin istenen tahmin veya sınıflandırma görevini verimli bir şekilde gerçekleştirmesi için büyük miktarda veriye ihtiyacımız var. Örneğin, görüntülerden bir köpeği tespit etmek, birini diğerinden doğru bir şekilde ayırt etmek için yüzlerce ve binlerce köpek ve köpek olmayan görüntü üzerinde bir sinir ağı modeli eğitmenizi gerektirecektir. Ancak, bu sinir ağı modeli, bir veya çok az eğitim verisi üzerinde eğitilirse çalışmayacaktır.
Veri eksikliği ile farklı katmanlarda ilgili özelliklerin çıkarılması zorlaşır. Model, farklı sınıflar arasında iyi bir genelleme yapamayacak ve bu nedenle genel performansını etkileyecektir.
Örnek olarak, bir havaalanındaki yüz tanıma örneğini düşünün. Bunda, her birinin farklı ifadeler, arka plan aydınlatması vb. içeren yüzlerce ve binlerce görüntüden oluşan modelimizi eğitme özgürlüğümüz yok. Her gün binlerce yolcunun gelmesi imkansız bir iştir! Ayrıca, bu kadar büyük miktarda veriyi depolamak maliyeti artırır.
Yukarıdaki problemin üstesinden gelmek için, birçok yeni örneği sınıflandırmak için bir veya birkaç örnekle sınıflandırma veya sınıflandırma görevlerinin gerçekleştirilebileceği bir teknik kullanıyoruz. Bu tekniğe Tek adımda öğrenme denir.
Son yıllarda, tek seferde öğrenme teknolojisi, yüz tanıma ve pasaport kontrollerinde yaygın olarak kullanılmaktadır. Kullanılan konsept şudur: Model, girdi 2 görüntü alır; biri pasaporttaki görüntü, diğeri ise kameraya bakan kişinin görüntüsü. Model daha sonra 2 görüntü arasındaki benzerlik olan bir değer verir. Çıktının değeri düşükse, iki görüntü benzerdir, aksi takdirde farklıdırlar.
İçindekiler
Siyam Ağı
Tek seferde öğrenme için kullanılan mimariye Siyam Ağı denir. Bu mimari, her biri farklı girdi alan iki paralel sinir ağından oluşur. Modelin çıktısı, iki girdi görüntüsünün benzer olup olmadığını gösteren bir değer veya benzerlik indeksidir. Önceden tanımlanmış bir eşiğin altındaki bir değer, iki görüntü arasındaki yüksek benzerliğe karşılık gelir ve bunun tersi de geçerlidir.
Görüntüler bir dizi Evrişim katmanından, maksimum havuz katmanından ve tam bağlantılı katmanlardan geçirildiğinde elde ettiğimiz şey, görüntülerin özelliklerini kodlayan bir vektördür. Burada iki görüntü girdiğimiz için, girdi görüntülerinin özelliklerini kapsayan iki vektör üretilecektir. Bahsettiğimiz değer, iki vektör arasındaki farkın normu bulunarak hesaplanabilen iki öznitelik vektörü arasındaki mesafedir.
üçlü kayıp fonksiyonu
Adından da anlaşılacağı gibi, modeli eğitmek için bir bağlantı (A) görüntüsü, bir pozitif (P) ve bir negatif (N) görüntü olmak üzere üç görüntüye ihtiyacımız var. Modele iki girdi sağlanabildiğinden, pozitif veya negatif bir görüntüye sahip bir çapa görüntüsü verilir. Model, parametreyi, çapa görüntü ile pozitif görüntü arasındaki mesafe az, çapa görüntü ile negatif görüntü arasındaki mesafe yüksek olacak şekilde öğrenir.
Yapıcı kayıp işlevi, A ile N arasındaki mesafe düşükse veya A ile P arasındaki mesafe yüksekse modeli cezalandırırken, A ile N arasındaki mesafe yüksek ve A ile P arasındaki mesafe düşük olduğunda modeli teşvik eder veya özellikleri öğrenir.
Çapa, olumlu ve olumsuz görüntüler hakkında daha fazla bilgi edinmek için, bunun bir havaalanındaki önceki örneğini ele alalım. Böyle bir durumda, çapa resmi kameraya baktığınızda sizin resminiz, pozitif resim pasaport fotoğrafınız ve negatif resim havaalanında bulunan bir yolcunun rastgele bir resmi olacaktır.
Bir Siaseme ağını her eğittiğimizde, ona APN üçlüsü (Anchor, pozitif ve negatif) görüntüleri sağlarız. Bu veri kümesini oluşturmak çok daha kolaydır ve eğitmek için daha az görüntü gerektirir.
Tek seferde öğrenmenin sınırlamaları
Tek seferde öğrenme hala olgun bir makine öğrenimi algoritmasıdır ve bazı sınırlamaları vardır. Örneğin, giriş görüntüsünde bazı değişiklikler varsa model iyi çalışmayacaktır - şapka, güneş gözlüğü ve diğerleri takan bir kişi. Ayrıca bir uygulama için eğitilen bir model başka bir uygulama için genellenemez.
Devam edersek, Sıfır-adım öğrenimi ve Az-atış öğrenimi içeren birkaç Tek-adım öğrenme varyasyonunu görelim.
Sıfır atış öğrenme
Sıfır atışlı öğrenme, modelin görülen veriler üzerinde eğitilirken yeni veya görünmeyen etiketli verileri tanımlama ve yeni veya görünmeyen verilerin anlamsal özelliklerini bilme yeteneğidir. Örneğin, kedi gören bir çocuk onu farklı özelliklerinden tanıyabilir. Ayrıca çocuk, köpeğin havladığının farkındaysa ve bir kediden daha sağlam özelliklere sahipse, köpeği tanımakta sorun olmayacaktır.
Sonuç olarak, ZSL tanımanın, görülen sınıfların etiketlenmiş eğitim setini ve görünmeyen her sınıfın görünen sınıflarla anlamsal olarak nasıl ilişkili olduğu bilgisini hesaba katan bir şekilde çalıştığını söyleyebiliriz.
N-shot öğrenme
Adından da anlaşılacağı gibi, N atışlı öğrenmede, eğitim için mevcut olan her sınıfın n etiketli verisine sahip olacağız. Model, her biri n etiketli veri içeren K sınıfı üzerinde eğitilmiştir. İlgili öznitelikleri ve kalıpları çıkardıktan sonra, modelin etiketlenmemiş yeni bir görüntüyü K sınıflarından birine sınıflandırması gerekir. Tamamen uçtan uca eğitilmiş en yakın komşu tabanlı yaklaşım üzerinde çalışan Eşleştirme ağlarını kullanırlar.
Çözüm
Sonuç olarak, Tek seferde öğrenme alanı ve benzerleri, bazı zorlu problemleri çözmek için muazzam bir potansiyele sahiptir. Nispeten yeni bir araştırma alanı olmasına rağmen, hızlı ilerleme kaydediyor ve araştırmacılar, makineler ve insanlar arasındaki boşluğu kapatmaya çalışıyor.
Böylelikle yazımızın sonuna gelmiş olduk, umarım keyifle okumuşsunuzdur.
Makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 450+ saat zorlu eğitim, 30'dan fazla vaka çalışması ve ödev, IIIT- sunan IIIT-B & upGrad'ın Makine Öğrenimi ve Yapay Zeka alanında PG Diplomasına göz atın. B Mezun statüsü, 5'ten fazla pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.
Dünyanın En İyi Üniversitelerinden ML Kursu öğrenin . Kariyerinizi hızlandırmak için Master, Executive PGP veya Advanced Certificate Programları kazanın.