Proyek & Topik Analisis Sentimen Untuk Pemula [2022]

Diterbitkan: 2021-01-09

Apakah Anda mempelajari analisis sentimen dan ingin menguji pengetahuan Anda? Jika ya, maka Anda datang ke tempat yang tepat. Dalam artikel ini, kami membahas ide proyek analisis sentimen yang dapat digunakan untuk menguji pengetahuan Anda dan menunjukkan pemahaman Anda.

Kami tahu betapa sulitnya menemukan ide proyek yang hebat. Kami juga tahu betapa bermanfaatnya menyelesaikan proyek. Dengan proyek, Anda dapat memperkuat pengetahuan Anda, meningkatkan portofolio Anda, dan mendapatkan peran yang lebih baik.

Bergabunglah dengan Kursus Pembelajaran Mesin Terbaik online dari Universitas top dunia – Magister, Program Pascasarjana Eksekutif, dan Program Sertifikat Tingkat Lanjut di ML & AI untuk mempercepat karier Anda.

Jadi tanpa basa-basi lagi, mari kita mulai.

Daftar isi

Apa itu Analisis Sentimen?

Analisis sentimen adalah sejenis penambangan data di mana Anda mengukur kecenderungan pendapat orang dengan menggunakan NLP (pemrosesan bahasa alami), analisis teks, dan linguistik komputasi. Kami melakukan analisis sentimen sebagian besar pada ulasan publik, platform media sosial, dan situs serupa. Berikut ini adalah jenis utama dari analisis sentimen:

berbutir halus

Analisis sentimen yang halus memberikan hasil yang tepat tentang opini publik tentang subjek tersebut. Ini mengklasifikasikan hasilnya dalam kategori yang berbeda seperti: Sangat Negatif, Negatif, Netral, Positif, Sangat Positif.

Mendeteksi Emosi

Analisis sentimen semacam ini mengidentifikasi emosi seperti marah, bahagia, sedih, dan lain-lain. Sering kali, Anda akan menggunakan leksikon untuk mengenali emosi. Namun, leksikon juga memiliki kekurangan, dan dalam kasus tersebut, Anda harus menggunakan algoritme ML.

Berdasarkan Aspek

Dalam analisis sentimen berbasis aspek, Anda melihat aspek dari hal yang dibicarakan orang. Misalkan Anda memiliki ulasan tentang ponsel cerdas, Anda mungkin ingin melihat apa yang dibicarakan orang-orang tentang masa pakai baterai atau ukuran layarnya.

Multibahasa

Terkadang organisasi perlu menganalisis teks dari berbagai bahasa. Bentuk analisis sentimen ini sangat menantang dan membutuhkan banyak usaha karena Anda membutuhkan banyak sumber daya.

Analisis sentimen memiliki banyak aplikasi di berbagai industri. Karena membantu dalam memahami opini publik, perusahaan menggunakan analisis sentimen dalam melakukan riset pasar dan mencari tahu apakah pelanggan mereka menyukai produk (atau layanan) tertentu atau tidak. Kemudian, menurut temuan analisis sentimen, organisasi dapat memodifikasi produk atau layanan masing-masing dan mencapai hasil yang lebih baik.

Secara keseluruhan, ini membantu perusahaan dalam memahami pelanggan mereka dengan lebih baik. Perusahaan dapat melayani pelanggan mereka dengan lebih baik ketika mereka tahu di mana mereka tertinggal dan di mana mereka unggul.

Dalam poin-poin berikut, kami telah membahas beberapa ide proyek analisis sentimen yang menonjol, pilih satu sesuai dengan minat dan keahlian Anda:

Ide Proyek Analisis Sentimen

Berikut ini adalah proyek analisis sentimen kami. Daftar kami memiliki proyek untuk semua tingkat keahlian sehingga Anda dapat memilih dengan nyaman:

1. Analisis Ulasan Produk Amazon

Amazon adalah toko e-commerce terbesar di planet ini. Ini berarti ia juga memiliki salah satu pilihan produk terbesar yang tersedia. Banyak kali, perusahaan ingin memahami opini publik tentang produk mereka dan mencari tahu apa yang bertanggung jawab untuk hal yang sama. Untuk tujuan itu, mereka melakukan analisis sentimen pada ulasan produk mereka.

Ini membantu mereka dalam mengenali masalah utama dengan produk mereka (jika ada). Beberapa produk memiliki ribuan ulasan di Amazon sementara yang lain hanya memiliki beberapa ratus.

Ini adalah salah satu proyek analisis sentimen karena permintaan akan keahlian semacam itu sangat tinggi. Perusahaan ingin para ahli menganalisis ulasan produk mereka untuk riset pasar.

Anda bisa mendapatkan dataset untuk proyek ini di sini: Amazon Product Reviews Dataset .

Bekerja pada proyek ini akan membuat Anda terbiasa dengan banyak aspek analisis sentimen. Jika Anda seorang pemula, Anda dapat memulai dengan produk kecil dan menganalisis ulasan yang sama. Di sisi lain, jika Anda mencari tantangan, Anda dapat mengambil produk populer dan menganalisis ulasannya.

2. Tomat Busuk dan Ulasannya

Rotten Tomatoes adalah situs ulasan tempat Anda akan menemukan kumpulan opini kritikus tentang film dan acara. Anda dapat menemukan ulasan di hampir setiap acara, serial TV, atau drama di sana. Diakui, ini juga merupakan tempat yang bagus untuk mendapatkan data.

Anda dapat melakukan analisis sentimen pada ulasan yang ada di situs ini sebagai bagian dari proyek analisis sentimen Anda. Sektor hiburan menanggapi ulasan kritikus dengan sangat serius. Dengan menganalisis ulasan kritikus, perusahaan produksi dapat memahami mengapa judul khususnya berhasil (atau gagal). Ulasan kritikus mempengaruhi kesuksesan komersial sebuah judul juga.

Dengan analisis sentimen, Anda dapat mengetahui apa pendapat umum kritikus terhadap film atau acara tertentu. Proyek ini adalah cara terbaik bagi Anda untuk mengetahui bagaimana analisis sentimen dapat membantu perusahaan hiburan seperti Netflix.

Anda bisa mendapatkan dataset untuk proyek ini di sini: Rotten Tomatoes dataset .

3. Analisis Sentimen Twitter

Twitter adalah tempat yang tepat untuk melakukan analisis sentimen. Anda bisa mendapatkan opini publik tentang topik apa pun melalui platform ini. Ini adalah salah satu ide proyek analisis sentimen tingkat menengah. Anda harus memiliki pengalaman dalam melakukan penambangan opini (nama lain untuk analisis sentimen) sebelum Anda mengerjakan tugas ini. Karena ini adalah ide proyek yang populer, kami telah membahas sedikit lebih detail:

Prasyarat

Anda harus memiliki pengetahuan dasar tentang pemrograman. Anda bisa akrab dengan Python atau R (akan lebih bagus jika Anda terbiasa dengan keduanya). Namun, tidak perlu memiliki pengetahuan pemrograman tingkat ahli. Selain pemrograman, Anda juga harus tahu cara membagi kumpulan data dan menggunakan RESTful API karena Anda harus menggunakan Twitter API di sini. Anda juga harus terbiasa dengan Naive Bayes Classifier karena kami akan menggunakannya untuk mengklasifikasikan data kami nanti dalam proyek.

Proyek ini tidak mudah, dan akan memakan sedikit waktu (mengunduh data dari twitter membutuhkan waktu berjam-jam).

Bekerja di Proyek

Pertama, Anda harus mendapatkan kredensial resmi dari Twitter untuk menggunakan API Twitter. Diperlukan beberapa waktu untuk mengotorisasi Akun Pengembang Twitter, tetapi setelah Anda memilikinya, Anda dapat membuka dasbor dan 'Buat aplikasi'.

Setelah Anda memiliki kredensial yang diperlukan, Anda dapat membuat fungsi dan membangun set pengujian. Twitter memiliki batasan jumlah permintaan yang dapat dibuat melalui API mereka, yang telah mereka tambahkan batas ini untuk alasan keamanan. Langit-langitnya adalah 180 permintaan dalam 15 menit. Anda dapat menyimpan set tes untuk memiliki 100 tweet.

Setelah membuat set pengujian, Anda harus membangun set pelatihan dengan menggunakan Twitter API, yang merupakan bagian tersulit dari proyek ini. Pastikan Anda menyimpan tweet yang Anda kumpulkan dari API dalam file CSV untuk digunakan di masa mendatang.

Setelah menyiapkan set pelatihan, Anda hanya perlu memproses terlebih dahulu tweet yang ada di set data. Ingat, emoji, gambar, dan komponen non-tekstual lainnya tidak memengaruhi polaritas analisis sentimen. Untuk memasukkan gambar dan bagian lain dalam analisis sentimen Anda, Anda harus menggunakan Deep Learning. Pastikan Anda menghapus semua karakter duplikat dan kesalahan ketik dari data Anda. Pembersihan data sangat penting untuk mendapatkan hasil terbaik.

Setelah membersihkan data, Anda dapat menggunakan Naive Bayes Classifier untuk menganalisis dataset yang tersedia. Terakhir, Anda harus menguji model Anda dan melihat apakah model tersebut memberikan hasil yang diinginkan atau tidak.

Seperti yang mungkin Anda sadari, proyek ini akan membutuhkan sedikit usaha. Tetapi melakukan analisis sentimen di Twitter adalah cara yang bagus untuk menguji pengetahuan Anda tentang subjek ini. Ini akan menjadi tambahan yang bagus untuk portofolio Anda (atau CV) juga.

Baca selengkapnya: Analisis Sentimen Menggunakan Python: Panduan Praktis

4. Review Karya Ilmiah

Jika Anda tertarik untuk menggunakan pengetahuan tentang pembelajaran mesin dan ilmu data untuk tujuan penelitian, maka proyek ini sangat cocok untuk Anda. Anda dapat melakukan analisis sentimen pada ulasan makalah ilmiah dan memahami pendapat para ahli terkemuka tentang topik tertentu. Temuan seperti itu dapat membantu Anda menelitinya dengan tepat.

Inilah kumpulan data sehingga Anda dapat memulai proyek ini: Kumpulan Data Pembelajaran Mesin . Dataset yang kami bagikan di sini memiliki N = 405 instance. Dan itu disimpan dalam format JSON. Mengerjakan proyek ini akan membuat Anda terbiasa dengan aplikasi pembelajaran mesin dalam penelitian ilmiah. Dataset memiliki beberapa ulasan dalam bahasa Spanyol dan beberapa dalam bahasa Inggris.

5. Analisis Ulasan IMDb

IMDb adalah situs web ulasan hiburan di mana orang-orang meninggalkan pendapat mereka tentang film dan acara yang berbeda. Anda dapat melakukan analisis sentimen pada ulasan yang ada di sana juga. Sama seperti proyek Rotten Tomatoes yang telah kita bahas sebelumnya, proyek ini akan membantu Anda mempelajari aplikasi ilmu data dan pembelajaran mesin di industri hiburan.

Ulasan acara dan film membantu perusahaan produksi dalam memahami mengapa judul mereka gagal (atau berhasil).

Dataset untuk proyek ini cukup tua dan kecil. Tetapi ini adalah cara yang sangat baik bagi seorang pemula untuk menguji keterampilannya pada kumpulan data baru. Berikut tautan ke kumpulan data: IMDb meninjau kumpulan data .

6. Menganalisis Reputasi Perusahaan (Berita + Media Sosial)

Anda dapat memilih perusahaan yang Anda sukai dan melakukan analisis sentimen terperinci di dalamnya. Anda juga dapat memilih topik yang sedang tren dan membahasnya dalam analisis sentimen Anda untuk hasil yang lebih tepat. Kita bisa membahas contoh Uber di sini. Mereka adalah salah satu startup paling terkemuka di dunia dan memiliki basis pelanggan global. Anda dapat melakukan analisis sentimen untuk memahami opini publik tentang perusahaan ini.

Untuk mengetahui opini publik tentang Uber, pertama-tama kita akan mulai dengan mendapatkan data dari sumber yang relevan, yang dalam hal ini adalah halaman Facebook dan halaman Twitter Uber. Dengan menganalisis percakapan antara pengguna di sana, kami dapat mengetahui persepsi merek secara keseluruhan di pasar. Anda memerlukan kategori untuk memisahkan kumpulan data yang berbeda. Dalam contoh ini, Anda dapat menggunakan Pembayaran, Layanan, Pembatalan, Keamanan, dan Harga.

Sekarang kita tahu apa yang ingin kita kerjakan dan ke mana kita harus pergi, kita bisa memulai.

Analisis Sentimen di Facebook

Pertama-tama kita akan mulai dengan halaman Facebook mereka. Ini memiliki lebih dari 30.000 komentar, dan setelah kami melakukan analisis di bawah kategori yang kami sebutkan sebelumnya (Pembayaran, Layanan, Batal, Keamanan, dan Harga) kami menemukan bahwa sebagian besar komentar positif adalah tentang bagian Harga. Sedangkan kategori dengan persentase tanggapan negatif tertinggi adalah pelayanan. Namun, saat melakukan analisis ini, kami juga ingat bahwa komentar Facebook dipenuhi dengan spam, saran, berita, dan berbagai informasi lainnya.

Untuk analisis sentimen, kita hanya perlu melihat opini.

Jadi, kami menghapus semua kategori yang tidak perlu, dan seperti yang diharapkan, hasil kami berubah. Sekarang, komentar negatif menjadi mayoritas di semua bagian, dan rasio mereka di masing-masing kategori berubah. Dalam komentar terkait Harga, persentase komentar negatif naik 20%.

Itulah mengapa penting untuk melakukan pembersihan data. Ini membantu Anda mendapatkan hasil yang akurat.

Analisis Sentimen di Twitter

Kami sudah membahas analisis sentimen tweet di artikel ini. Jadi kami akan mengikuti pendekatan serupa di sini dan menganalisis tweet orang-orang di mana mereka menandai Uber atau membalas tweet mereka. Di sini, kategori dengan persentase tweet positif tertinggi adalah Pembayaran, dan tertinggi kedua adalah Keamanan. Ini juga menunjukkan bagaimana media sosial yang berbeda memberikan hasil yang berbeda.

Namun, kami juga harus melakukan pembersihan data di sini. Untuk tujuan itu, kami akan menghapus tweet dengan maksud yang tidak terkait (spam, berita, pemasaran, dll.). Anda akan melihat berapa banyak persentase perubahan kategori yang berbeda di sini juga.

Dalam kasus kami, Pembayaran mengalami penurunan 12% dalam pangsa tweet positif dan Keamanan menjadi kategori dengan persentase tanggapan positif tertinggi. Selain itu, Safety kehilangan sekitar 2-4% dalam pangsa tweet positifnya. Dengan data ini, Anda juga dapat mengetahui topik apa yang paling populer di antara orang-orang ketika mereka berbicara tentang Uber di platform ini.

Jadi, di Twitter, kami menemukan bahwa kategori yang paling populer adalah pembayaran, Batal, dan layanan.

Anda harus tahu bahwa merek mengambil data ini dengan sangat serius. Ini membantu mereka mencari tahu masalah apa yang perlu mereka tangani dan bagaimana mereka bisa menyelesaikannya. Tweet ini, bagaimanapun, adalah umpan balik dari pelanggan. Dalam hal ini, Uber dapat menggunakan temuan tweet ini untuk memahami bagian mana dari layanannya yang memiliki kesalahan dan bagaimana mereka dapat memperbaikinya.

Analisis Sentimen Berita

Untuk memahami opini publik tentang organisasi mana pun, Anda juga harus menganalisis berita tentangnya. Dalam contoh kami, kami akan memeriksa artikel berita tentang Uber. Setelah kami menganalisis konten yang ada dalam artikel berita tersebut, kami akan memisahkan temuan kami dalam kategori yang disebutkan di atas (Pembayaran, Layanan, Pembatalan, Keamanan, dan Harga).

Selain itu, kami juga akan mengklasifikasikan artikel yang berbeda menurut popularitasnya. Semakin populer sebuah artikel, semakin mempengaruhi opini publik. Anda bisa mengukur popularitas setiap artikel sesuai dengan jumlah share yang mereka miliki. Kolom dengan share yang lebih tinggi pasti akan lebih populer daripada kolom dengan share yang lebih sedikit.

Hasil

Dalam contoh kami, kami melihat Uber dan opini publik tentang perusahaan ini. Setelah kami menganalisis Facebook, Twitter, dan berita, kami akan tahu apakah sentimen umum tentang Uber adalah positif, negatif, atau netral.

Anda dapat mengikuti pendekatan ini untuk membuat ide analisis proyek sentimen. Anda dapat memulai dengan perusahaan kecil yang tidak memiliki kehadiran online yang tinggi dan melakukan analisis sentimen di berbagai saluran untuk memahami apakah itu dianggap positif atau negatif. Jika Anda ingin meningkatkan tantangan, Anda dapat membuatnya lebih rumit dan melakukan analisis untuk perusahaan besar (seperti yang kami lakukan dalam contoh kami).

Baca Juga: 4 Ide Proyek Analisis Data Teratas: Tingkat Pemula hingga Ahli

Pikiran Akhir

Analisis Sentimen adalah topik penting dalam pembelajaran mesin. Ini memiliki banyak aplikasi di berbagai bidang. Jika Anda ingin mempelajari lebih lanjut tentang topik ini, Anda dapat mengunjungi blog kami dan menemukan banyak sumber daya baru.

Di sisi lain, jika Anda ingin mendapatkan pengalaman belajar yang komprehensif dan terstruktur, juga jika Anda tertarik untuk mempelajari lebih lanjut tentang pembelajaran mesin, lihat Program PG Eksekutif IIIT-B & upGrad dalam Pembelajaran Mesin & AI yang dirancang untuk bekerja profesional dan menawarkan 450+ jam pelatihan yang ketat, 30+ studi kasus & tugas, status Alumni IIIT-B, 5+ proyek batu penjuru praktis & bantuan pekerjaan dengan perusahaan-perusahaan top.

Masalah apa yang dipecahkan oleh analisis sentimen?

Analisis sentimen menjadi alat penting untuk memantau dan memahami sentimen klien saat mereka membagikan pendapat dan emosi mereka secara lebih terbuka daripada sebelumnya. Merek dapat mengetahui apa yang membuat klien puas atau frustrasi dengan secara otomatis mengevaluasi umpan balik pelanggan, seperti komentar dalam balasan survei dan dialog media sosial. Hal ini memungkinkan mereka untuk menyesuaikan produk dan layanan agar sesuai dengan permintaan pelanggan mereka. Misalnya, menggunakan analisis sentimen untuk memeriksa 4.000+ survei tentang bisnis Anda dapat membantu Anda mengetahui apakah pelanggan menyukai harga dan layanan pelanggan Anda.

Apa saja tantangan dari analisis sentimen?

Bahkan manusia berjuang untuk menafsirkan sentimen secara efektif, menjadikan analisis sentimen salah satu tugas tersulit di nlp. Setiap ucapan diucapkan pada suatu saat, di suatu tempat, oleh dan kepada beberapa orang, dan seterusnya. Semua pernyataan dibuat dalam konteks. Orang-orang menyampaikan sikap negatif mereka menggunakan frasa positif dalam ironi dan sarkasme, yang mungkin sulit dikenali oleh robot tanpa pengetahuan mendetail tentang situasi di mana emosi diekspresikan. Kesulitan lain yang perlu diatasi dalam analisis sentimen adalah bagaimana menangani perbandingan. Masalah lain yang harus diatasi untuk melakukan analisis sentimen yang efektif adalah mendefinisikan apa yang kami maksud dengan netral.

Bagaimana Anda dapat meningkatkan akurasi analisis sentimen?

Saat mengerjakan masalah klasifikasi, sangat penting untuk memilih korpora tes dan pelatihan dengan bijak. Pengetahuan domain diperlukan agar sekumpulan fitur dapat bertindak dalam proses klasifikasi. Dalam sebagian besar situasi ilmu data, disarankan menggunakan metode klasifikasi pada corpora yang dibersihkan daripada corpus yang berisik. Kata kunci yang jarang muncul di korpus biasanya tidak berperan dalam klasifikasi teks. Karakteristik yang jarang ini dapat dihilangkan, menghasilkan kinerja model yang lebih baik. Biasanya merupakan ide yang baik untuk mengurangi istilah ke versi yang paling sederhana. Lemmatization adalah nama untuk metode ini.