Skip to content

Repository ini berisi proyek analisis sentimen terhadap ulasan Mobile Legends menggunakan algoritma Logistic Regression. Proyek ini dikembangkan sebagai bagian dari kelas pengembangan Machine Learning, mencakup preprocessing data, pelatihan model, serta evaluasi performa untuk mengukur akurasi prediksi sentimen.

License

Notifications You must be signed in to change notification settings

Masdarul/Proyek-Analisis-Sentimen

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Analisis Sentimen Ulasan Mobile Legends: Bang Bang

Ikhtisar

Proyek ini bertujuan untuk melakukan analisis sentimen pada ulasan pengguna dari game mobile populer Mobile Legends: Bang Bang. Analisis ini berfokus pada ulasan berbahasa Indonesia untuk mengidentifikasi sentimen positif dan negatif dari para pemain. Dengan menganalisis ulasan-ulasan tersebut, kita dapat memperoleh wawasan tentang pendapat pemain, mengidentifikasi masalah umum, dan memahami sentimen keseluruhan terhadap game ini.

Struktur Proyek

├── data
│   ├── mlbb.csv
│   └── mlbb.xlsx
|── README.md
├── Notebook.ipynb
└── requirements.txt

Penjelasan Tahapan

Pengumpulan data

Data yang digunakan dalam proyek ini adalah data ulasan dari game Mobile Legends: Bang Bang. Data dikumpulkan melalui web scraping dengan fokus pada ulasan yang berlokasi di Indonesia, berbahasa Indonesia, paling relevan, dan representatif. Data ulasan ini disimpan dalam file CSV dan Excel.

Pra-pemrosesan Data

Data yang dikumpulkan perlu diproses sebelum digunakan dalam model. Tahapan ini meliputi:

  • Filter Atribut Penting: Memilih atribut yang relevan untuk analisis sentimen.
  • Menghapus Missing Value: Menghapus data yang tidak lengkap.
  • Menghapus Duplikat: Menghapus data yang duplikat.
  • Pembersihan Teks (Cleaning Text): Menghapus karakter khusus, tanda baca, dan angka yang tidak relevan.
  • Case Folding: Mengubah semua teks menjadi huruf kecil untuk konsistensi.
  • Tokenisasi Teks (Tokenizing Text): Membagi teks ulasan menjadi unit-unit yang lebih kecil seperti kata atau frasa.
  • Filtering Teks: Menghapus kata-kata umum (stop words) yang tidak membawa makna penting dalam analisis sentimen.
  • Stemming Teks: Mengubah kata-kata menjadi bentuk dasarnya.
  • Membuat Slangword secara Manual: Menyesuaikan kata-kata slang dalam ulasan agar sesuai dengan makna sebenarnya.
  • Menggabungkan Teks: Menggabungkan semua proses di atas ke dalam satu kolom baru.

Eksplorasi label

Tahapan ini melibatkan pemberian label Positif dan Negatif pada data ulasan berdasarkan analisis dari proyek GitHub orang lain. Selanjutnya, dilakukan visualisasi data untuk memahami distribusi sentimen.

alt text
Dari ulasan aplikasi Mobile Legends, terlihat bahwa mayoritas ulasan bersifat negatif sebanyak 68.6%, sedangkan ulasan positif hanya 31.4%.

alt text
Visualisasi ini menunjukkan kata-kata yang paling sering digunakan dalam ulasan positif, memberikan gambaran tentang aspek-aspek yang dihargai oleh pengguna.

alt text
Visualisasi ini menunjukkan kata-kata yang paling sering digunakan dalam ulasan negatif, memberikan gambaran tentang aspek-aspek yang dikeluhkan oleh pengguna.

Pembagian Data dan Ekstraksi Fitur

Pada tahap ini, data ulasan dibagi menjadi dua set: data pelatihan (80%) dan data pengujian (20%). Selanjutnya, fitur diekstraksi dari teks ulasan menggunakan teknik TF-IDF (Term Frequency-Inverse Document Frequency). Ekstraksi fitur ini bertujuan untuk mengubah teks ulasan menjadi representasi numerik yang dapat digunakan oleh model machine learning.

Pelatihan Model

Model Logistic Regression yang dilatih berhasil mencapai akurasi 86% pada data pelatihan dan 85% pada data pengujian. Hasil ini menunjukkan bahwa model mampu mengklasifikasikan sentimen ulasan dengan cukup baik.

Kontribusi

Kami menyambut kontribusi dari siapa pun yang tertarik untuk memperbaiki proyek ini. Harap baca panduan kontribusi sebelum mengajukan pull request.

Lisensi

Proyek ini dilisensikan di bawah Lisensi MIT.

About

Repository ini berisi proyek analisis sentimen terhadap ulasan Mobile Legends menggunakan algoritma Logistic Regression. Proyek ini dikembangkan sebagai bagian dari kelas pengembangan Machine Learning, mencakup preprocessing data, pelatihan model, serta evaluasi performa untuk mengukur akurasi prediksi sentimen.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published