Yeni Başlayanlar İçin Duygu Analizi Projeleri ve Konuları [2022]

Yayınlanan: 2021-01-09

Duygu analizi mi okuyorsunuz ve bilginizi test etmek mi istiyorsunuz? Eğer öyleyseniz, o zaman doğru yere geldiniz. Bu makalede, bilginizi test edebileceğiniz ve anlayışınızı sergileyebileceğiniz duygu analizi proje fikirlerini tartışıyoruz.

Harika proje fikirleri bulmanın ne kadar zor olduğunu biliyoruz. Ayrıca projeleri tamamlamanın ne kadar faydalı olduğunu da biliyoruz. Projelerle bilginizi güçlendirebilir, portföyünüzü geliştirebilir ve daha iyi roller üstlenebilirsiniz.

Kariyerinizi hızlandırmak için Dünyanın En İyi Üniversiteleri - Yüksek Lisanslar, Yönetici Yüksek Lisans Programları ve Makine Öğrenimi ve Yapay Zeka alanında İleri Düzey Sertifika Programından çevrimiçi En İyi Makine Öğrenimi Kursuna katılın .

O halde lafı fazla uzatmadan başlayalım.

İçindekiler

Duygu Analizi Nedir?

Duygu analizi, NLP (doğal dil işleme), metin analizi ve hesaplamalı dilbilim kullanarak insanların görüşlerinin eğilimini ölçtüğünüz bir tür veri madenciliğidir. Duygu analizini çoğunlukla herkese açık incelemelerde, sosyal medya platformlarında ve benzer sitelerde gerçekleştiriyoruz. Duygu analizinin ana türleri şunlardır:

ince taneli

İnce taneli duygu analizi, kamuoyunun konuyla ilgili ne olduğuna dair kesin sonuçlar verir. Sonuçlarını Çok Negatif, Negatif, Nötr, Olumlu, Çok Olumlu gibi farklı kategorilerde sınıflandırdı.

Duyguyu Tespit Etme

Bu tür bir duygu analizi, öfke, mutluluk, üzüntü ve diğerleri gibi duyguları tanımlar. Çoğu zaman, duyguları tanımak için sözlükleri kullanacaksınız. Ancak sözlüklerin de dezavantajları vardır ve bu durumlarda makine öğrenimi algoritmalarını kullanmanız gerekir.

Görünüşe Dayalı

Görünüme dayalı duygu analizinde, insanların bahsettiği şeyin yönüne bakarsınız. Bir akıllı telefon incelemeniz olduğunu varsayalım, insanların pil ömrü veya ekran boyutu hakkında neler konuştuğunu görmek isteyebilirsiniz.

Çok dilli

Bazen kuruluşların farklı dillerdeki metinleri analiz etmesi gerekir. Bu duygu analizi biçimi oldukça zordur ve çok fazla kaynağa ihtiyaç duyacağınız için çok çaba gerektirir.

Duyarlılık analizinin çeşitli endüstrilerde birçok uygulaması vardır. Kamuoyunu anlamaya yardımcı olduğu için şirketler, pazar araştırması yaparken ve müşterilerinin belirli bir ürünü (veya hizmeti) beğenip beğenmediğini anlamak için duyarlılık analizini kullanır. Ardından, duyarlılık analizinin bulgularına göre kuruluş, ilgili ürün veya hizmeti değiştirebilir ve daha iyi sonuçlar elde edebilir.

Sonuç olarak, şirketlerin müşterilerini daha iyi anlamalarına yardımcı olur. Şirketler, nerede geciktiklerini ve nerede başarılı olduklarını bildiklerinde müşterilerine daha iyi hizmet verebilirler.

Aşağıdaki noktalarda, öne çıkan bazı duygu analizi proje fikirlerini tartıştık, ilgi alanlarınıza ve uzmanlığınıza göre birini seçin:

Duygu Analizi Proje Fikirleri

Aşağıdakiler, duygu analizi projelerimizdir. Listemizde rahatça seçim yapabilmeniz için tüm beceri seviyelerine uygun projeler bulunmaktadır:

1. Amazon Ürün İncelemelerini Analiz Edin

Amazon, gezegendeki en büyük e-ticaret mağazasıdır. Bu, aynı zamanda mevcut en geniş ürün seçeneklerinden birine sahip olduğu anlamına gelir. Çoğu zaman şirketler, ürünleriyle ilgili kamuoyunu anlamak ve bundan neyin sorumlu olduğunu bulmak ister. Bu amaçla, ürün incelemelerinde duyarlılık analizi yaparlar.

Ürünleriyle ilgili birincil sorunları (varsa) tanımalarına yardımcı olur. Bazı ürünlerin Amazon'da binlerce yorumu varken, bazılarının sadece birkaç yüzü var.

Bu tür bir uzmanlığa olan talep çok yüksek olduğu için en duygu analizi projelerinden biridir. Şirketler, uzmanların pazar araştırması için ürün incelemelerini analiz etmelerini ister.

Bu proje için veri kümesini buradan edinebilirsiniz: Amazon Ürün İncelemeleri Veri Kümesi .

Bu proje üzerinde çalışmak, duygu analizinin birçok yönüne aşina olmanızı sağlayacaktır. Yeni başlayan biriyseniz, küçük bir ürünle başlayabilir ve aynı ürünün incelemelerini analiz edebilirsiniz. Öte yandan, bir meydan okuma arıyorsanız, popüler bir ürünü alıp incelemelerini analiz edebilirsiniz.

2. Çürük Domatesler ve İncelemeleri

Rotten Tomatoes, filmler ve şovlar hakkında eleştirmenlerin görüşlerini bulabileceğiniz bir inceleme sitesidir. Orada hemen hemen her şov, TV dizisi veya drama hakkında incelemeler bulabilirsiniz. Kuşkusuz, veri almak için de harika bir yer.

Duyarlılık analizi projelerinizin bir parçası olarak bu sitede bulunan incelemeler üzerinde duygu analizi yapabilirsiniz. Eğlence sektörü eleştirileri çok ciddiye alıyor. Bir prodüksiyon şirketi, eleştirmen incelemelerini analiz ederek, belirli başlığının neden başarılı (veya başarısız) olduğunu anlayabilir. Eleştirmen incelemeleri, bir başlığın ticari başarısını da önemli ölçüde etkiler.

Duygu analizi ile, belirli bir film veya şov hakkındaki eleştirmenlerin genel görüşünün ne olduğunu anlayabilirsiniz. Bu proje, duygu analizinin Netflix gibi eğlence şirketlerine nasıl yardımcı olabileceğini anlamanız için mükemmel bir yoldur.

Bu proje için veri setine buradan ulaşabilirsiniz: Rotten Tomatoes dataset .

3. Twitter Duygu Analizi

Twitter, duygu analizi yapmak için harika bir yerdir. Bu platform aracılığıyla herhangi bir konuda kamuoyu edinebilirsiniz. Bu, orta seviye duygu analizi proje fikirlerinden biridir. Bu görev üzerinde çalışmadan önce fikir madenciliği (duygu analizi için başka bir isim) gerçekleştirme konusunda biraz deneyime sahip olmalısınız. Popüler bir proje fikri olduğundan, biraz daha ayrıntılı olarak tartıştık:

Önkoşullar

Temel programlama bilgisine sahip olmalısınız. Python veya R'ye aşina olabilirsiniz (ikisine de aşina iseniz harika olur). Ancak, uzman düzeyinde programlama bilgisine sahip olmak gerekli değildir. Programlamanın yanı sıra, burada Twitter API'sini kullanmanız gerekeceğinden, veri kümelerini nasıl böleceğinizi ve RESTful API'yi nasıl kullanacağınızı da bilmelisiniz. Ayrıca projede daha sonra verilerimizi sınıflandırmak için kullanacağımız için Naive Bayes Sınıflandırıcısına da aşina olmalısınız.

Bu proje kolay değil ve biraz zaman alacak (twitter'dan veri indirmek saatler sürüyor).

Projede Çalışmak

İlk olarak, Twitter API'sini kullanmak için Twitter'dan yetkili kimlik bilgileri almanız gerekir. Bir Twitter Geliştirici Hesabını yetkilendirmek biraz zaman alır, ancak bir kez sahip olduğunuzda, kontrol panelinize gidebilir ve 'Bir uygulama oluştur' seçeneğine gidebilirsiniz.

Gerekli kimlik bilgilerine sahip olduktan sonra işlevi oluşturabilir ve bir test seti oluşturabilirsiniz. Twitter, API'leri aracılığıyla yapılabilecek istek sayısında bir sınıra sahiptir ve güvenlik nedeniyle bu sınırı eklemiştir. Tavan, 15 dakikada 180 istektir. Test setini 100 tweet olacak şekilde tutabilirsiniz.

Test setini oluşturduktan sonra bu projenin en zor kısmı olan Twitter API kullanarak eğitim setini oluşturmanız gerekecek. API'den topladığınız tweet'leri ileride kullanmak üzere bir CSV dosyasına kaydettiğinizden emin olun.

Eğitim setini hazırladıktan sonra sadece veri setlerinde bulunan tweetleri önceden işlemeniz yeterlidir. Unutmayın, emojiler, resimler ve diğer metinsel olmayan bileşenler, duygu analizinin polaritesini etkilemez. Duygu analizinize resimleri ve diğer parçaları dahil etmek için Derin Öğrenmeyi kullanmanız gerekir. Tüm yinelenen karakterleri ve yazım hatalarını verilerinizden kaldırdığınızdan emin olun. Veri temizleme, mümkün olan en iyi sonuçları elde etmek için hayati önem taşır.

Verileri temizledikten sonra, mevcut veri setini analiz etmek için Naive Bayes Sınıflandırıcısını kullanabilirsiniz. Son olarak, modelinizi test etmeniz ve istenen sonuçları verip vermediğini görmeniz gerekir.

Fark etmiş olabileceğiniz gibi, bu proje biraz çaba gerektirecektir. Ancak Twitter'da duygu analizi yapmak, bu konudaki bilginizi test etmenin harika bir yoludur. Portföyünüze (veya CV'nize) de harika bir katkı olacaktır.

Devamını oku: Python Kullanarak Duygu Analizi: Uygulamalı Bir Kılavuz

4. Bilimsel Makalelerin İncelemeleri

Araştırma amacıyla makine öğrenimi ve veri bilimi bilgilerini kullanmakla ilgileniyorsanız, bu proje tam size göre. Bilimsel makalelerin incelemelerinde duygu analizi yapabilir ve önde gelen uzmanların belirli bir konu hakkında ne düşündüğünü anlayabilirsiniz. Böyle bir bulgu, onları buna göre araştırmanıza yardımcı olabilir.

İşte bu projeye başlayabilmeniz için veri seti: Machine Learning Dataset . Burada paylaştığımız veri kümesinde N = 405 örnek bulunmaktadır. Ve JSON formatında saklanır. Bu proje üzerinde çalışmak, bilimsel araştırmalarda makine öğrenimi uygulamalarına aşina olmanızı sağlayacaktır. Veri kümesinde bazı İspanyolca ve bazı İngilizce incelemeler var.

5. IMDb İncelemelerini Analiz Edin

IMDb, insanların farklı filmler ve şovlar hakkında görüşlerini paylaştığı bir eğlence inceleme sitesidir. Orada bulunan incelemelerde de duygu analizi yapabilirsiniz. Tıpkı daha önce tartıştığımız Rotten Tomatoes projesi gibi, bu proje de eğlence endüstrisinde veri bilimi ve makine öğrenimi uygulamaları hakkında bilgi edinmenize yardımcı olacak.

Gösterilerin ve filmlerin incelemeleri, yapım şirketlerinin oyunlarının neden başarısız olduğunu (veya başarılı olduğunu) anlamalarına yardımcı olur.

Bu projenin veri seti oldukça eski ve küçük. Ancak, yeni başlayanlar için becerilerini yeni bir veri kümesinde test etmek için mükemmel bir yoldur. İşte veri kümesine bir bağlantı: IMDb veri kümesini inceler .

6. Bir Şirketin İtibarını Analiz Edin (Haberler + Sosyal Medya)

Beğendiğiniz bir firmayı seçip detaylı bir duygu analizi yapabilirsiniz. Ayrıca, trend olan bir konu seçebilir ve daha kesin bir sonuç için onu duygu analizinize dahil edebilirsiniz. Uber örneğini burada tartışabiliriz. Dünyanın en önde gelen girişimlerinden biri ve küresel bir müşteri tabanına sahipler. Bu şirket hakkındaki kamuoyunu anlamak için bir duygu analizi yapabilirsiniz.

Uber hakkındaki kamuoyunu bulmak için öncelikle ilgili kaynaklardan, bu örnekte Uber'in Facebook sayfası ve Twitter sayfası olan verileri alarak başlayacağız. Oradaki kullanıcılar arasındaki konuşmaları analiz ederek pazardaki genel marka algısını anlayabiliriz. Farklı veri kümelerini ayırmak için kategorilere ihtiyacınız olacak. Bu örnekte, Ödeme, Hizmet, İptal, Güvenlik ve Fiyat'ı kullanabilirsiniz.

Artık ne üzerinde çalışmak istediğimizi ve nereye gitmemiz gerektiğini bildiğimize göre başlayabiliriz.

Facebook'ta Duygu Analizi

İlk önce Facebook sayfalarıyla başlayacağız. 30.000'den fazla yorumu var ve daha önce bahsettiğimiz kategoriler (Ödeme, Hizmet, İptal, Güvenlik ve Fiyat) altında analiz yaptığımızda, olumlu yorumların çoğunun Fiyat bölümü ile ilgili olduğunu gördük. Öte yandan, olumsuz geri bildirim yüzdesinin en yüksek olduğu kategori hizmet oldu. Ancak bu analizi yaparken Facebook'un yorumlarının spam, öneri, haber ve diğer çeşitli bilgilerle dolu olduğunu da unutmadık.

Duygu analizi için sadece görüşlere bakmamız gerekir.

Böylece gereksiz tüm kategorileri kaldırdık ve beklendiği gibi sonuçlarımız değişti. Artık olumsuz yorumlar tüm bölümlerde çoğunluktaydı ve ilgili kategorilerdeki oranları değişti. Fiyatla ilgili yorumlarda, olumsuz yorumların yüzdesi %20 arttı.

Bu nedenle veri temizliği yapmak çok önemlidir. Doğru sonuçlar almanıza yardımcı olur.

Twitter'da Duygu Analizi

Bu makalede tweetlerin duygu analizini zaten tartıştık. Bu yüzden burada benzer bir yaklaşım izleyeceğiz ve insanların Uber'i etiketledikleri veya tweet'lerine yanıt verdikleri tweet'lerini analiz edeceğiz. Burada, en yüksek olumlu tweet yüzdesine sahip kategori Ödeme ve ikinci en yüksek Güvenlik oldu. Bu da farklı sosyal medyanın ne kadar farklı sonuçlar verdiğini gösteriyor.

Ancak burada da veri temizliği yapmamız gerekecekti. Bu amaçla, alakasız amaçlarla (spam, haber, pazarlama vb.) tweet'leri kaldıracağız. Burada da farklı kategorilerin yüzdesinin ne kadar değiştiğini fark edeceksiniz.

Bizim durumumuzda Ödeme, olumlu tweet payında %12'lik bir düşüş gördü ve Güvenlik, en yüksek olumlu yanıt yüzdesine sahip kategori oldu. Bunun dışında Safety, olumlu tweet payında yaklaşık %2-4 oranında kayıp yaşadı. Bu verilerle, bu platformlarda insanlar arasında Uber hakkında konuşurken en popüler konuların neler olduğunu da öğrenebilirsiniz.

Böylece, Twitter'da en popüler kategorilerin ödeme, İptal ve hizmet olduğunu gördük.

Markaların bu verileri çok ciddiye aldığını bilmelisiniz. Hangi sorunlar üzerinde çalışmaları gerektiğini ve bunları nasıl çözebileceklerini anlamalarına yardımcı olur. Bu tweetler, sonuçta, müşterilerin geri bildirimleridir. Bu durumda Uber, hizmetlerinin hangi bölümlerinde hata olduğunu ve bunları nasıl düzeltebileceklerini anlamak için bu tweet'lerin bulgularını kullanabilir.

Haber Duyarlılık Analizi

Herhangi bir kuruluş hakkındaki kamuoyunu anlamak için, o kuruluşla ilgili haberleri de analiz etmeniz gerekir. Örneğimizde, Uber ile ilgili haber makalelerini kontrol edeceğiz. Bu haber makalelerinde bulunan içeriği analiz ettikten sonra, bulgularımızı yukarıda belirtilen kategorilere (Ödeme, Hizmet, İptal, Güvenlik ve Fiyat) ayıracağız.

Bunun dışında farklı makaleleri de popülerliklerine göre sınıflandıracağız. Bir makale ne kadar popüler olursa, kamuoyunu o kadar çok etkiler. Her makalenin popülerliğini sahip oldukları paylaşım sayısına göre ölçebilirsiniz. Daha yüksek paya sahip bir sütun, şüphesiz daha az paya sahip olandan daha popüler olacaktır.

Sonuçlar

Örneğimizde Uber'e ve bu şirket hakkındaki kamuoyuna baktık. Facebook, Twitter ve haberleri analiz ettikten sonra, Uber hakkındaki genel düşüncenin olumlu mu, olumsuz mu yoksa tarafsız mı olduğunu anlarız.

Duygu proje analizi fikirleri oluşturmak için bu yaklaşımı takip edebilirsiniz. Çevrimiçi varlığı yüksek olmayan ve olumlu mu yoksa olumsuz mu algılandığını anlamak için birden çok kanalda duygu analizi yapan küçük bir şirketle başlayabilirsiniz. Zorluğu artırmak istiyorsanız, daha karmaşık hale getirebilir ve büyük bir şirket için analiz yapabilirsiniz (örneğimizde yaptığımız gibi).

Ayrıca Okuyun: En İyi 4 Veri Analitiği Proje Fikri: Başlangıç ​​Düzeyinde Uzman Düzeyinde

Son düşünceler

Duygu Analizi, makine öğreniminde önemli bir konudur. Birçok alanda çok sayıda uygulamaya sahiptir. Bu konu hakkında daha fazla bilgi edinmek istiyorsanız, blogumuza gidebilir ve birçok yeni kaynak bulabilirsiniz.

Öte yandan, kapsamlı ve yapılandırılmış bir öğrenme deneyimi elde etmek istiyorsanız ve makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, IIIT-B & upGrad'ın makine öğrenimi ve yapay zeka alanında çalışmak için tasarlanmış Executive PG Programına göz atın. 450+ saat sıkı eğitim, 30'dan fazla vaka çalışması ve ödev, IIIT-B Mezunu statüsü, 5'ten fazla pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı sunar.

Duygu analizi hangi sorunları çözer?

Müşterilerin görüşlerini ve duygularını her zamankinden daha açık bir şekilde paylaştıkları için duygu analizi, müşteri duyarlılığını izlemek ve anlamak için çok önemli bir araç haline geliyor. Markalar, anket yanıtlarındaki yorumlar ve sosyal medya diyalogları gibi müşteri geri bildirimlerini otomatik olarak değerlendirerek müşterilerini neyin memnun ettiğini veya hayal kırıklığına uğrattığını bilebilir. Bu, ürün ve hizmetleri müşterilerinin taleplerine uyacak şekilde özelleştirmelerine olanak tanır. Örneğin, işletmenizle ilgili 4.000'den fazla anketi incelemek için duyarlılık analizi kullanmak, müşterilerin fiyatlandırmanızı ve müşteri hizmetlerinizi beğenip beğenmediğini anlamanıza yardımcı olabilir.

Duygu analizinin zorlukları nelerdir?

İnsanlar bile duyguları etkili bir şekilde yorumlamakta zorlanıyor ve bu da duygu analizini nlp'deki en zor görevlerden biri haline getiriyor. Her söz, zamanın bir anında, bir yerde, bazı insanlar tarafından ve bazı insanlar için yapılır ve bu böyle devam eder. Tüm açıklamalar bağlam içinde yapılır. İnsanlar, olumsuz tutumlarını, bir duygunun ifade edildiği durum hakkında ayrıntılı bir bilgi olmadan robotların tanıması zor olabilen, ironi ve alaycılıkta olumlu ifadeler kullanarak iletir. Duygu analizinde ele alınması gereken bir diğer zorluk, karşılaştırmaların nasıl ele alınacağıdır. Etkili duygu analizi yapmak için üstesinden gelinmesi gereken bir diğer konu, tarafsız ile ne demek istediğimizi tanımlamaktır.

Bir duygu analizinin doğruluğunu nasıl artırabilirsiniz?

Bir sınıflandırma problemi üzerinde çalışırken, test ve eğitim külliyatını akıllıca seçmek çok önemlidir. Bir dizi özelliğin sınıflandırma sürecinde hareket etmesi için alan bilgisi gereklidir. Çoğu veri bilimi durumunda, gürültülü bir derlem yerine temizlenmiş bir corpora üzerinde bir sınıflandırma yöntemi kullanılması tavsiye edilir. Derlemde nadiren yer alan anahtar kelimelerin metin sınıflandırmasında genellikle bir rolü yoktur. Bu sık olmayan özellikler kaldırılabilir ve bu da geliştirilmiş model performansıyla sonuçlanır. Terimleri en basit biçimlerine indirgemek genellikle iyi bir fikirdir. Lemmatization bu yöntemin adıdır.