CNN Derin Öğrenme Kılavuzu

Yayınlanan: 2022-10-14

Yapay zekanın insan ve makine becerileri arasındaki boşluğu kapatma yeteneği önemli ölçüde arttı. Hem profesyoneller hem de amatörler, harika sonuçlar elde etmek için alanın birçok yönüne odaklanır. Bilgisayarla görme alanı, bu tür birkaç disiplinden biridir.

İçindekiler

ABD'deki AI ve ML Programlarımız

LJMU ve IIITB'den Makine Öğrenimi ve Yapay Zekada Bilim Ustası IIITB'den Makine Öğrenimi ve Yapay Zeka Alanında Yönetici PG Programı
Tüm kurslarımızı keşfetmek için aşağıdaki sayfamızı ziyaret edin.
Makine Öğrenimi Kursları

Alan, bilgisayarlara dünyayı insanlar gibi görme ve anlama becerisi kazandırmayı ve bu anlayışı görüntü ve video tanıma, görüntü analizi ve sınıflandırma, medya yeniden oluşturma, öneri sistemleri, doğal dil işleme vb. dahil olmak üzere çeşitli görevler için kullanmayı amaçlar. Evrişimli Sinir Ağı zaman içinde bilgisayar vizyonundaki derin öğrenme iyileştirmelerini geliştirmek ve iyileştirmek için kullanılan birincil algoritmadır. Derin öğrenme algoritması hakkında daha fazlasını öğrenelim!

Dünyanın En İyi Üniversitelerinden Makine Öğrenimi Sertifikası Alın. Kariyerinizi hızlandırmak için Master, Executive PGP veya Gelişmiş Sertifika Programları kazanın.

Evrişim Sinir Ağı Nedir?

Bir Evrişimsel Sinir Ağı veya CNN, bir girdi görüntüsünü alabilen, görüntüde öğrenilebilir ağırlıklar ve önyargılar gibi çeşitli öğe ve nesnelere önem veren ve bunlar arasında ayrım yapabilen bir derin öğrenme yöntemidir. Nispeten konuşursak, bir CNN, diğer sınıflandırma tekniklerinden önemli ölçüde daha az ön işleme gerektirir. CNN bu filtreleri ve özellikleri öğrenme kapasitesine sahiptir, oysa ilkel tekniklerde filtreler elle yapılır.

Bir CNN'nin mimarisi, Görsel Korteksin nasıl organize edildiğinden etkilenir ve insan beynindeki nöronların bağlantı ağına benzer. Bireysel nöronlar, yalnızca Alıcı Alan olarak bilinen bu kısıtlı görme alanı alanında uyaranlara tepki verir. Bu tür örtüşen bir dizi tüm görsel alanı kaplar.

Evrişim Sinir Ağı mimarisi

Evrişimli sinir ağlarının mimarisi, geleneksel sinir ağlarından farklıdır. Normal bir sinir ağı, bir girdiyi birkaç gizli katmandan geçirerek dönüştürür. Her katman, altındaki katmandaki tüm nöronlara bağlı bir dizi nörondan oluşur. Son tamamen bağlı çıktı katmanı, tahminlerin temsil edildiği yerdir.

Evrişimli sinir ağları biraz farklı yapılandırılmıştır. Katmanlar önce üç boyutta düzenlenir: genişlik, yükseklik ve derinlik. Ek olarak, bir sonraki katmandaki nöronların yalnızca bir kısmı, aşağıdaki katmandakilere bağlanır. Çıktı daha sonra tek bir olasılık skor vektöründe yoğunlaştırılacak ve evrişim katmanı ile birlikte gruplandırılacaktır.

CNN iki bölümden oluşur:

Gizli katmanlardan özelliklerin çıkarılması

Ağ, özellikleri tespit etmek için bu bölümde bir dizi evrişim ve havuzlama işlemi yapacaktır. Bu, ağın bir kaplanın çizgilerini, iki kulağı ve bir resminiz varsa dört bacağı tanımlayacağı yerdir.

Bölüm Sınıflandırması

Bu alınan özelliklerin yanı sıra, bu durumda evrişim katmanları bir sınıflandırıcı olarak çalışacaktır. Görüntünün nesnesinin algoritmanın tahminiyle eşleşme olasılığını verecekler.

Özelliklerin çıkarılması

CNN'nin temel bileşenlerinden biri evrişimdir. Üçüncü bir işlev elde etmek için iki işlevin matematiksel olarak birleştirilmesine evrişim denir. İki veri grubunu birleştirir. Bir filtre veya çekirdek kullanan bir CNN durumunda giriş verileri üzerinde evrişim gerçekleştirerek bir özellik haritası oluşturulur. Evrişim, filtreyi giriş üzerinde hareket ettirerek gerçekleştirilir. Her konum bir matris çarpımı gerçekleştirir ve çıktıyı özellik haritasına toplar.

Her işlem için farklı bir filtre kullanarak girişte birkaç evrişim yapıyoruz. Sonuç olarak, çeşitli özellik haritaları üretilir. Evrişim katmanının çıktısı, nihai olarak tüm bu özellik haritaları kullanılarak birleştirilir.

Diğer tüm sinir ağları gibi, çıktımızı doğrusal olmayan hale getirmek için bir aktivasyon süreci kullanıyoruz; burada aktivasyon fonksiyonu, evrişimli bir sinir ağında evrişimin çıktısını göndermek için kullanılır.

Evrişim Sinir Ağı Türleri

Evrişim Katmanı:

CNN'nin temel bileşeni evrişim katmanıdır. Ağ üzerindeki hesaplama yükünün çoğunu taşır. Bu katman, biri çekirdek, öğrenilebilir parametreler topluluğu ve diğeri alıcı alanın kısıtlı alanı olan iki matris arasında bir nokta çarpımı yapar. Bir resimle karşılaştırıldığında, çekirdek uzayda daha küçük ama daha derindir. Bu, görüntü üç kanaldan oluşuyorsa, çekirdeğin genişliğinin ve yüksekliğinin uzamsal olarak küçük olacağını gösterir; yine de, derinlik üç kanala da yükselecek.

Çekirdek, ileri geçiş sırasında resmin yüksekliği ve genişliği boyunca hareket eder ve bu alıcı bölgenin bir görüntü temsilini oluşturur. Sonuç olarak, bir aktivasyon haritası adı verilen görüntünün iki boyutlu bir temsili oluşturulur ve görüntüdeki her bir konumdaki çekirdeğin tepkisini ortaya çıkarır. Adım, çekirdeğin kaydırılabilir boyutunun adıdır.

Havuzlama Katmanı:

Bu katman yalnızca verileri işlemek için gereken bilgi işlem gücünü azaltır. Vurgulanan matrisin boyutlarının daha da azaltılmasıyla gerçekleştirilir. Bu katmandaki mahallenin küçük bir bölümünden baskın özellikleri çıkarmaya çalışıyoruz.

Ortalama havuzlama ve Maks havuz oluşturma, iki farklı havuzlama stratejisi türüdür.

Havuzlama bölgesindeki tüm değerler arasında en yüksek değeri alan Maks havuzlamanın aksine, Ortalama havuzlama havuzlama bölgesindeki tüm değerlerin ortalamasını alır.

Artık katmanları bir araya getirdikten sonra görüntünün temel öğelerini içeren bir matrisimiz var ve bu matrisin boyutları daha da küçük, bu da sonraki aşamada çok yardımcı olacak.

Tamamen Bağlı Katman:

Evrişimsel katmanın çıktısı tarafından sağlanan yüksek seviyeli karakteristiklerin doğrusal olmayan permütasyonlarını öğrenmenin ucuz bir yöntemi, Tam Bağlantılı bir katman eklemektir. Bu alanda, Tam Bağlı katman şimdi doğrusal olmayabilecek bir işlevi öğreniyor.

Çok seviyeli algılayıcımız için uygun bir formata dönüştürdükten sonra, giriş görüntüsünü bir sütun vektörüne düzleştireceğiz. İleri beslemeli bir sinir ağı, düzleştirilmiş çıktıyı alır ve her eğitim yinelemesi için geri yayılım kullanılır. Model, birçok çağda baskın ve belirli düşük seviyeli özellikleri tanımlayarak Softmax Sınıflandırma yöntemini kullanarak görüntüleri kategorilere ayırabilir.

Doğrusal Olmayan Katmanlar:

Doğrusal olmayan katmanlar, aktivasyon haritasına doğrusal olmayanlık eklemek için genellikle evrişim katmanından hemen sonra dahil edilir, çünkü evrişim doğrusal bir işlemdir ve görüntüler doğrusaldan başka bir şey değildir.

Doğrusal olmayan işlemler, en yaygın olanları olmak üzere çeşitli biçimlerde gelir:

sigmoid

Sigmoid doğrusal olmayanlığın matematiksel formülü () = 1/(1+e )'dir. 0 ile 1 arasındaki gerçek değerli bir sayıyı yok eder. Bir sigmoidin gradyanı, aktivasyon kuyrukta olduğunda neredeyse sıfır olur, bu çok elverişsiz bir sigmoid özelliğidir. Yerel gradyan çok küçülürse, geri yayılım gradyanı etkili bir şekilde öldürür. Ek olarak, nörona girdinin yalnızca pozitif olduğunu varsayalım. Bu durumda, sigmoid çıktısı ya yalnızca pozitif ya da yalnızca negatif olacak ve ağırlık için gradyan güncellemelerinin zikzak dinamiğine yol açacaktır.

Tan

Tanh, gerçek değerli bir sayıyı [-1, 1] aralığına yoğunlaştırır. Sigmoid nöronlar gibi, aktivasyon doyurur, ancak onlardan farklı olarak çıktısı sıfır merkezlidir.

ReLU

Rektifiye Doğrusal Birim (ReLU) son zamanlarda çok popülerlik kazanmıştır. ()=max (0,) fonksiyonunun hesaplanmasını gerçekleştirir. Başka bir deyişle, aktivasyon sadece sıfır eşikte var olur. ReLU, yakınsamayı altı kat hızlandırır ve sigmoid ve tanh'dan daha güvenilirdir.

Ne yazık ki, ReLU eğitim sırasında kırılgan olabilir ve bu bir dezavantajdır. Güçlü bir gradyan, nöronun daha fazla güncellenmesini önleyerek onu güncelleyebilir. Ancak bu işi uygun bir öğrenme oranı seçerek yapabiliriz.

Popüler Makine Öğrenimi ve Yapay Zeka Blogları

IoT: Tarih, Bugün ve Gelecek Makine Öğrenimi Eğitimi: Makine Öğrenimi Öğrenin Algoritma nedir? Basit ve Kolay
Hindistan'da Robotik Mühendisi Maaşı : Tüm Roller Bir Makine Öğrenimi Mühendisinin Hayatından Bir Gün: Ne yapıyorlar? IoT (Nesnelerin İnterneti) Nedir?
Permütasyon ve Kombinasyon: Permütasyon ve Kombinasyon Arasındaki Fark Yapay Zeka ve Makine Öğreniminde En İyi 7 Trend R ile Makine Öğrenimi: Bilmeniz Gereken Her Şey

UpGrad ile CNN Derin Öğrenme rehberinize başlayın

LJMU ile işbirliği içinde UpGrad'da Makine Öğrenimi ve Yapay Zeka alanında Master of Science'a kaydolun.

Sertifika programı, endüstriyle ilgili konular sağlayarak öğrencileri mevcut ve olası teknik rollere hazırlar. Programda, konu uzmanları tarafından sunulan gerçek projeler, çoklu vaka çalışmaları ve uluslararası akademisyenler de yoğun bir şekilde vurgulanmaktadır.

Kaydolarak, UpGrad'ın ağ izleme, çalışma oturumları ve 360 ​​derece öğrenim desteği gibi ayrıcalıklı özelliklerinden yararlanabilirsiniz.

CNN'nin derin öğrenme algoritması nedir?

CNN'nin çalışma şekli, bir görüntü elde etmek, görüntüdeki çeşitli öğelere bağlı olarak ona bir ağırlık atamak ve ardından bunları birbirinden ayırmaktır. Diğer derin öğrenme algoritmalarıyla karşılaştırıldığında, CNN, verilerin çok az ön işlenmesini gerektirir.

CNN'yi derin öğrenmeden ayıran nedir?

Derin öğrenme, pazarlamada olduğundan daha profesyonel görünmek için daha sık kullanılır. CNN de dahil olmak üzere çok sayıda derin sinir ağı çeşidi vardır. CNN'ler, görüntü tanımlamada sayısız avantajlı kullanımları nedeniyle çok beğenilmektedir.

CNN neden tam bağlantılı olmaktan üstün?

Konvolüsyonların yoğun bağlantıları yoktur ve tüm girdi düğümlerinin her çıktı düğümü üzerinde etkisi yoktur. Bu sayede evrişimli katmanlar artık daha fazla esneklikle öğrenebilir. Ek olarak, görüntü verileri gibi yüksek boyutlu girdilere fayda sağlayan katman başına daha az ağırlık vardır.

CNN sadece resimler için mi kullanılıyor?

Evet. Herhangi bir 2B ve 3B veri dizisi CNN kullanılarak işlenebilir.