Makine Öğreniminde Zincir Kuralı Türevi: Açıklama

Yayınlanan: 2021-06-30

Makine Öğrenimi, son yıllarda ve tüm iyi nedenlerle en çok konuşulan ve araştırılan alanlardan biri haline geldi. Her gün yeni makine öğrenimi modelleri ve uygulamaları keşfediliyor ve dünyanın dört bir yanındaki araştırmacılar bir sonraki büyük şey için çalışıyor.

Sonuç olarak, makine öğrenimine geçmek ve devam eden bu devrimin bir parçası olmak için farklı geçmişlere sahip profesyonellere artan bir ilgi oldu. İlk adımlarını atmak isteyen makine öğrenimi meraklılarından biriyseniz, bunun her şeyden önce matematiğin ve istatistiğin temellerini anlamakla başladığını söyleyelim.

Matematikte makine öğrenimi ile son derece alakalı olan hayati bir konu türevlerdir. Temel hesap anlayışınıza göre, herhangi bir fonksiyonun türevinin, o fonksiyonun anlık değişim oranı olduğunu hatırlarsınız. Bu blogda, türevleri daha derinlemesine inceleyeceğiz ve zincir kuralını keşfedeceğiz. Denklemde bazı bağımsız değişkenleri değiştirdiğimizde belirli bir fonksiyonun çıktısının nasıl değiştiğini göreceğiz. Zincir kuralı türevleri bilgisiyle, makine öğreniminde mutlaka karşılaşacağınız daha karmaşık işlevleri ayırt etme üzerinde çalışabileceksiniz.

Kariyerinizi hızlandırmak için Makine Öğrenimi sertifikasyonunu dünyanın en iyi üniversitelerinden - Yüksek Lisanslar, Yönetici Yüksek Lisans Programları ve Makine Öğrenimi ve Yapay Zeka alanında İleri Düzey Sertifika Programından çevrimiçi olarak alın .

İçindekiler

Zincir Kuralı Türevini Anlamak

Zincir kuralı esasen bileşik bir fonksiyonun türevini hesaplamanıza yardımcı olan matematiksel bir formüldür. Bileşik bir işlev, iki veya daha fazla işlevden oluşan bir işlevdir. Dolayısıyla, eğer f ve g iki fonksiyon ise, o zaman zincir kuralı, sis veya go f gibi bileşik fonksiyonların türevini bulmamıza yardımcı olur .

Sis bileşik fonksiyonu göz önüne alındığında, zincir kuralı türevi şöyle görünür:

Yukarıdaki kural şu şekilde de yazılabilir:

Burada F fonksiyonu, f ve g'nin f(g(x)) formundaki bileşimidir .

Şimdi, diyelim ki üçüncü değişken (z) ikinci değişkene (y) ve bu da birinci değişkene (x) bağlı olacak şekilde üç değişkenimiz olsun. Bu durumda zincir kuralı türevi şuna benzer:

Derin öğrenme açısından, bu aynı zamanda geri yayılım problemlerini çözmek için düzenli olarak kullanılan formüldür. Şimdi, z'nin y'ye ve y'nin de x'e bağlı olduğundan bahsettiğimize göre, z = f(y) ve y = g(x) yazabiliriz. Bu ikame, diferansiyel denklemimizi aşağıdaki şekilde değiştirir:

Şimdi, arkalarındaki matematiği daha iyi anlamak için zincir kuralı türevlerinin bazı örneklerine bakalım.

Zincir Kuralı Türev Örnekleri ve Uygulamaları

Zincir kuralı türevini daha iyi anlamak için Wikipedia'dan iyi bilinen bir örnek alalım. Gökyüzünden serbest düşüş yaptığınızı varsayalım. Düşüş sırasında karşılaştığınız atmosfer basıncı sürekli değişmeye devam edecektir. İşte atmosfer basıncındaki bu değişikliği yükseklik seviyeleriyle gösteren bir grafik:

Düşüşünüzün deniz seviyesinden 4000 metre yükseklikte başladığını varsayalım. Başlangıçta hızınız sıfırdı ve ivme değeri yerçekimi nedeniyle saniyede 9,8 metre kare idi.

Şimdi bu durumu bir önceki zincir kuralı yöntemiyle karşılaştıralım. Bu örnekte, zaman için x yerine 't' değişkenini kullanacağız.

O halde, düşüşün başlangıcından bu yana kat edilen mesafeyi söyleyen y = g(t) değişkeni şu şekilde verilebilir:

g(t) = 0,5*9,8t^2

Ve deniz seviyesinden yükseklik, 400-g(t)'ye eşit olacak bir 'h' değişkeni ile verilebilir.

Bir modele dayanarak, herhangi bir h yüksekliğindeki atmosferik basıncın fonksiyonunu şu şekilde de yazabileceğimizi varsayalım :

f(h) = 101325 e−0,0001h

Şimdi, aşağıdaki sonuçları elde etmek için iki denklemi bağımlı değişkenlerine göre ayırt edebilirsiniz:

g′(t) = -9.8t,

Burada g'(t), herhangi bir t anındaki hızınızın değerini söyler .

f′(h) = -10.1325e−0.0001h

Burada f'(h), atmosfer basıncının h yüksekliğine göre değişim oranıdır. Şimdi, soru şu ki, bu iki denklemi birleştirip zamana göre atm basıncının değişim oranını türetebilir miyiz? Zincir kuralını kullanmayı görelim:

Elimizdeki son denklem bize atmosfer basıncının düşüşten bu yana geçen süreye göre değişen oranını verir. Makine öğrenimi açısından, sinir ağları, nöronun tahmindeki hatasıyla ilgili olarak sürekli olarak ağırlık güncellemelerine ihtiyaç duyar. Zincir kuralı, bu ağırlıkların ayarlanmasına ve makine öğrenimi modelini doğru çıktıya yaklaştırmasına yardımcı olur.

Çözüm

Gördüğünüz gibi zincir kuralı birçok amaç için faydalıdır. Özellikle makine öğrenimi veya derin öğrenme söz konusu olduğunda, zincir kuralı, nöronların ağırlıklarını güncellemede ve modelin genel verimliliğini artırmada çok fazla kullanım alanı bulur.

Artık zincir kuralının temellerinin farkında olduğunuza göre, devam edin ve kendi başınıza birkaç problem deneyin. Birkaç bileşik fonksiyona bakın ve türevlerini bulmaya çalışın. Ne kadar çok pratik yaparsanız, kavramlarınız o kadar netleşir ve makine öğrenimi modellerinizi eğitmeniz o kadar kolay olur! Bununla birlikte, bir makine öğrenimi meraklısıysanız ancak bu alandaki ilk adımlarınızı atmakta zorlanıyorsanız, upGrad arkanızda!

Makine Öğrenimi ve Yapay Zeka alanındaki Yönetici PG Programımız, IIIT -Bangalore ile işbirliği içinde sunulur ve size sektörle ilgili altı uzmanlık seçeneği sunar. Kurs, zemin seviyesinden başlar ve endüstri uzmanlarından 1'e 1 destek, güçlü bir akran öğrenci grubu ve 360 derece kariyer desteği sağlarken sizi zirveye götürür.

Degradeler makine öğreniminde nasıl kullanılır?

Gradyan vektörü, sınıflandırma ve regresyon problemlerinde sıklıkla kullanılır. Gradyan iniş, bir tür optimizasyon algoritmasıdır. Gradyan inişi, bir diferansiyel fonksiyonun yerel minimumunu bulmak için geliştirildiğinden, modelin maliyet fonksiyonunu en aza indiren optimum parametreleri belirlemek için makine öğrenimi modellerinde yaygın olarak kullanılır.

Sinir ağlarında aktivasyon fonksiyonlarını kullanmanın amacı nedir?

Bir aktivasyon fonksiyonunun amacı, lineer olmayan özelliklere sahip bir sinir ağında bir fonksiyon sunmaktır. Verilerdeki karmaşık kalıpları anlamada ağa yardımcı olmak için etkinleştirme işlevine sahip bir yapay sinir ağı kullanılır. Bir sinir ağı, bir girdi vektörü ile bir ağırlık matrisi arasındaki nokta-çarpımlar ileri yayılım sırasında matematiksel işlem olarak hareket ederek, girdilerden çıktılara yalnızca doğrusal eşlemeler gerçekleştirebilir. Aktivasyon fonksiyonlarını kullanarak modelin neler yaratabileceğine dair güvenilir tahminler elde edebilirsiniz.

Makine öğrenimi için iyi bir matematik bilgisine sahip olmak önemli midir?

Analiz, değişim hızı hesaplamasına dayalı bir hata fonksiyonunu en aza indiren gradyan iniş yöntemi gibi makine öğrenimi algoritmalarının iç dinamiklerini anlamak için gereklidir. Yeni başlayan biriyseniz, makine öğreniminde başarılı olmak için matematiğin arkasındaki tüm fikirleri anlamanız gerekmez. Yalnızca cebir ve kalkülüs ilkelerini bilerek idare edebilirsiniz, ancak bir veri bilimcisiyseniz ve makine öğrenimi projenizin perde arkasında neler olup bittiğini bilmek istiyorsanız, kalkülüs ilkelerini derinlemesine bilmeniz gerekir. .