Yeni Başlayanlar İçin 9 İlginç Doğrusal Regresyon Projesi Fikirleri ve Konuları [222]

Yayınlanan: 2021-01-09

Doğrusal regresyon, makine öğreniminde popüler bir konudur. Denetimli bir öğrenme algoritmasıdır ve birçok sektörde uygulama bulur. Bu konuyu öğreniyorsanız ve becerilerinizi test etmek istiyorsanız, birkaç doğrusal regresyon projesi denemelisiniz. Bu yazıda da aynı şeyi tartışıyoruz.

Uzmanlığınıza ve ilgi alanlarınıza göre birini seçebilmeniz için farklı beceri seviyeleri ve alanları için doğrusal regresyon proje fikirlerimiz var. Ayrıca, veri kümenize eklediğiniz veri değerlerini artırarak (veya azaltarak) burada bahsettiğimiz herhangi bir projenin zorluk seviyesini değiştirebilirsiniz.

Kariyerinizi hızlandırmak için Dünyanın En İyi Üniversiteleri - Yüksek Lisanslar, Yönetici Yüksek Lisans Programları ve Makine Öğrenimi ve Yapay Zeka alanında İleri Düzey Sertifika Programından çevrimiçi Derin Öğrenme Kursuna katılın .

İçindekiler

Doğrusal Regresyon nedir?

Lineer Regresyon, makine öğreniminde denetimli bir öğrenme algoritmasıdır. Bağımsız değişkenlere göre bir tahmin değeri modeller ve bu değişkenler ile tahmin arasındaki ilişkinin bulunmasına yardımcı olur. Regresyon modelleri, bağımsız ve bağımlı değişkenler arasındaki ilişkiye ve kullandıkları değişken sayısına bağlıdır.

Doğrusal regresyon, bağımsız değişkene (x) göre bağımlı değeri (y) tahmin eder. Buradaki çıktı bağımlı değerdir ve girdi bağımsız değerdir. Doğrusal regresyon için hipotez fonksiyonu aşağıdaki gibidir:

Y = 1 + 2x

Doğrusal regresyon modeli, sağlanan x değerine göre y'nin değerini tahmin eden en iyi doğruyu bulur. En iyi satırı elde etmek için 1 ve 2 için en uygun değerleri bulur . 1 , kesişme noktası ve 2 , x'in katsayısıdır. 1 ve 2 için en iyi değerleri bulduğumuzda, lineer regresyonunuz için de en iyi doğruyu buluruz.

Artık lineer regresyonun temel kavramlarını tartıştığımıza göre, lineer regresyon proje fikirlerimize geçebiliriz.

En İyi Doğrusal Regresyon Projesi Fikirlerimiz

Fikir 1: Uzun Bir Sürüş İçin Bütçe Yapın

Diyelim ki uzun bir yolculuğa çıkmak istiyorsunuz (Delhi'den Lonawala'ya). Bu kadar uzun bir yolculuğa çıkmadan önce, bir bütçe hazırlamak ve belirli bir bölüm için ne kadar harcamanız gerektiğini hesaplamak en iyisidir. Almanız gereken gazın maliyetini belirlemek için burada doğrusal bir regresyon modeli kullanabilirsiniz.

Bu lineer regresyonda, ödemeniz gereken toplam para miktarı bağımlı değişken olacaktır, yani modelimizin çıktısı olacaktır. Hedefler arasındaki mesafe bağımsız değişken olacaktır. Modeli basit tutmak için, yolculuk sırasında yakıt fiyatının sabit kalacağını varsayabiliriz.

Bu proje için herhangi iki hedef seçebilirsiniz. Yeni başlayanlar için harika bir proje fikri çünkü konsepti net bir şekilde denemenize ve anlamanıza izin veriyor. Ayrıca, uzun bir sürüş planladığınızda da modeli kullanabilirsiniz!

Fikir #2: İşsizlik Oranlarını Hisse Senedi Kazançlarıyla Karşılaştırın

Bir ekonomi meraklısıysanız veya bu alanda Makine Öğrenimi bilginizi kullanmak istiyorsanız, bu sizin için en iyi doğrusal regresyon projesi fikirlerinden biridir. İşsizliğin ülkemiz için ne kadar önemli bir sorun olduğunu hepimiz biliyoruz. Bu projede, işsizlik oranları ile borsada meydana gelen kazançlar arasındaki ilişkiyi bulacağız.

İşsizlik oranlarını almak için hükümetin resmi verilerini kullanabilir ve bununla borsadaki kazançlar arasında bir ilişki olup olmadığını öğrenmek için kullanabilirsiniz.

Okuyun: Python'da Doğrusal Regresyon Uygulaması

Fikir #3: Vurucu Maaşlarını Maç Başına Aldıkları Ortalama Koşularla Karşılaştırın

Kriket, Hindistan'daki en popüler oyundur. Vurucu oyuncu maaşları ile her oyunda puanladıkları ortalama koşular arasındaki ilişkiyi çizeceğiniz bu basit ama heyecan verici projede makine öğrenimi bilginizi kullanabilirsiniz. Kriket oyuncularımız dünyanın en çok kazanan sporcuları arasındadır. Bu proje üzerinde çalışmak, vuruş ortalamalarının kazançlarından ne kadar sorumlu olduğunu öğrenmenize yardımcı olacaktır.

Yeni başlayan biriyseniz, bir takımla başlayabilir ve vurucularının maaşlarını kontrol edebilirsiniz. Öte yandan, bir adım daha ileri gitmek isterseniz, birden fazla takım (Avustralya, İngiltere, Güney Afrika vb.) düşünebilir ve onların topa vuran oyuncularının maaşlarını da kontrol edebilirsiniz.

Fikir #4: Bir Aydaki Tarihleri ​​Aylık Maaşla Karşılaştırın

Bu proje, makine öğreniminin insan kaynakları ve yönetimindeki uygulamasını araştırıyor. Başlangıç ​​seviyesindeki lineer regresyon projeleri arasındadır, yani daha önce böyle bir proje üzerinde çalışmadıysanız, bununla başlayabilirsiniz. Burada, bir ay içinde mevcut olan tarihleri ​​alacak ve aylık maaşla karşılaştıracaksınız.

İki değişken arasındaki ilişkiyi kurduktan sonra, mevcut ücretin optimal olup olmadığını keşfedebilirsiniz. Herhangi bir kariyeri seçebilir ve bağımsız değişken olarak seçmek için ortalama maaşını bulabilirsiniz. Orijinali dışında birçok işi tartışarak bu projeyi daha zorlu hale getirebilirsiniz.

Fikir #5: Ortalama Küresel Sıcaklıkları ve Kirlilik Düzeylerini Karşılaştırın

Kirlilik ve çevre üzerindeki etkisi önemli bir tartışma konusudur. Son pandemi bize çevremizi nasıl kurtarabileceğimizi de gösterdi. Makine öğrenimi becerilerinizi bu alanda da kullanabilirsiniz. Bu proje, makine öğreniminin bu alanda da mevcut olan çeşitli sorunları nasıl çözebileceğini anlamanıza yardımcı olacaktır.

Burada, birkaç yıldaki ortalama küresel sıcaklıkları alır ve bu süre içinde meydana gelen kirlilik seviyesiyle karşılaştırırsınız. Bu konuda doğrusal bir regresyon modeli oluşturmak kolaydır ve fazla çaba gerektirmez. Ancak, makine öğrenimi becerilerinizi denemenize kesinlikle yardımcı olacaktır.

Fikir #6: Yerel Sıcaklığı Yağmur Miktarı ile Karşılaştırın

Bu, doğa ve çevre sevenler için başka bir heyecan verici proje fikri. Bu projede, yerel sıcaklık ile orada meydana gelen yağmur miktarı arasındaki ilişkiyi bulmalısınız. Bu projeyi tamamladıktan sonra, Coğrafya ve ilgili konularda lineer regresyon ve diğer makine öğrenimi tekniklerini nasıl kullanabileceğinizi göreceksiniz.

Sıcaklığı Celsius ve yağmur miktarını mm (milimetre) cinsinden tutmalısınız. Yeni başlayanlar için ülkenin önde gelen birkaç şehrini (Yeni Delhi, Mumbai, Pune, Jaipur gibi) düşünebilir ve projeyi tamamladıkça daha fazlasını ekleyebilirsiniz.

Fikir #7: İnsanların Ortalama Yaşını Uyku Miktarlarıyla Karşılaştırın

Uyku, bilim adamlarımızı her zaman büyülemiştir. Ve bu konuya da ilgi duyuyorsanız, o zaman bu konu üzerinde çalışmalısınız. Bu projede, insanların ortalama yaşam sürelerini aldıkları uyku miktarıyla karşılaştırmanız gerekiyor.

Biyoteknoloji veya sinirbilim alanına makine öğreniminde uzmanlıkla girmek istiyorsanız, bu sizin için mükemmel bir seçimdir. Bu sektörlerdeki lineer regresyon uygulamalarını keşfetmenize yardımcı olur. Bu konuyla ilgili birçok araştırma makalesi vardır, bu nedenle ilgili veri kaynaklarını bulmakta sorun yaşamayacaksınız.

Fikir #8: Nehirdeki Sedimentlerin Yüzdesini Deşarjıyla Karşılaştırın

Bu, çevre ve coğrafya meraklıları için başka bir heyecan verici proje fikri. Burada, suda bulunan tortu yüzdesini deşarj seviyesiyle karşılaştırmanız gerekir. Bir nehirle başlayabilir ve daha fazla akış ekleyerek daha zorlu hale getirebilirsiniz. Benzer şekilde, daha önce lineer regresyon projeleri üzerinde çalışmadıysanız, küçük bir akarsu (veya dev bir nehrin bir bölümü) ile başlayabilirsiniz.

Bir nehrin deşarjı, kanalını takip eden hacimdir. Belirli bir noktadan geçen suyun toplam hacmi ve bir nehrin debisini saniyede metreküp cinsinden ölçmek için kullanılan birimdir. Sedimentler , nehir boyunca hareket eden ve yeni bir yere biriken bir akıntıda bulunan katı maddelerdir.

Fikir #9: Ulusal Film Ödülleri'ne aday gösterilen Filmlerin Bütçelerini Bu Ödülleri Kazanan Filmlerin sayısıyla karşılaştırın

Eğlence sektöründe de lineer regresyon uyguluyorsunuz. Bu projede Ulusal Film Ödülleri'ne aday gösterilen filmlerin bütçelerini, bu ödülleri kazanan filmlerin sayısı ile karşılaştırmanız gerekiyor. Bir filmin bütçesinin ödül kazanma olasılığını etkileyip etkilemediğini öğrenirsiniz. Son beş yılın (2014-19) verileriyle başlayabilirsiniz. Ve eğer bir seviye daha ileri gitmek istiyorsanız, o zaman daha fazla yıldan veri ekleyebilir ve projeyi daha zorlu hale getirebilirsiniz.

Ayrıca Okuyun: Yeni Başlayanlar İçin 15 İlginç Makine Öğrenimi Projesi Fikri

Son düşünceler

Proje listemizin sonuna geldik. Umarız bu doğrusal regresyon proje fikirlerini faydalı bulmuşsunuzdur. Doğrusal regresyon veya bu proje fikirleriyle ilgili herhangi bir sorunuz varsa, bize sormaktan çekinmeyin.

Öte yandan, doğrusal regresyon hakkında daha fazla bilgi edinmek istiyorsanız, bu konuyla ilgili birçok değerli kaynak, kılavuz ve makale bulabileceğiniz blogumuza gitmenizi öneririz. Yeni başlayanlar için, makine öğreniminde doğrusal regresyonla ilgili kılavuzumuz burada .

upGrad ile birlikte IIT Delhi'nin Makine Öğreniminde Yönetici PG Programını kontrol edebilirsiniz. IIT Delhi , Hindistan'daki en prestijli kurumlardan biridir. Konularında en iyi olan 500'den fazla kurum içi öğretim üyesi ile.

Doğrusal regresyonda izlenecek önemli adımlar nelerdir?

Doğrusal regresyon analizinde, bir dizi veri noktası içinden doğrusal bir çizgi uydurmaktan daha fazlası vardır. Üç aşaması vardır: (1) korelasyon ve yönlülük için verileri incelemek, (2) modeli tahmin etmek, yani çizgiye uydurmak ve (3) modelin geçerliliğini ve faydasını değerlendirmek. Başlamak için, verileri değerlendirmek ve yönlülük ve korelasyonu doğrulamak için bir dağılım grafiği kullanın. Regresyon doğrusunun uydurulması, regresyon analizinin ikinci aşamasıdır. Açıklanamayan artık, matematiksel en küçük kareler tahmini kullanılarak en aza indirilir. Anlamlılık testi, doğrusal regresyon analizinin son aşamasıdır.

Doğrusal regresyon neden normal dağılıma ihtiyaç duyar?

Bazı kullanıcılar yanlışlıkla lineer regresyonun normal dağılım varsayımının verileri için geçerli olduğuna inanırlar. Normal dağılımdan ayrılıp ayrılmadığını görmek için yanıt değişkenlerinin histogramını yapabilirler. Diğerleri, açıklayıcı değişkenin düzenli olarak dağıtılmış bir dağılıma sahip olması gerektiğine inanıyor. İkisi de gerekli değil. Normallik varsayımı artık dağılımlar için geçerlidir. Veriler normal olarak dağıtılır, ayrıca regresyon çizgisi verilerle eşleştirilir, böylece artık ortalama sıfır olur.

Doğrusal regresyonun avantajları ve dezavantajları nelerdir?

Doğrusal regresyon analizinin en önemli faydası onların doğrusallığıdır: Tahmin sürecini basitleştirir ve daha da önemlisi, bu doğrusal denklemlerin anlaşılması kolay modüler bir yorumu (yani ağırlıklar) vardır. Doğrusal regresyon, yalnızca Bağımlı Değişkenin ortalamasını dikkate alır. Bağımlı değişkenin ortalaması ile bağımsız değişkenler arasındaki bağlantı, doğrusal regresyon kullanılarak incelenir. Aykırı değerler Doğrusal Regresyonu etkileyebilir.