Analisa Pemodelan Topik Berita Daring Menggunakan Semi-Supervised dan Fully Unsupervised Latent Dirichlet Allocation

Authors

  • Khoirunnisa Fi Nurdin Universitas Islam Negeri Syarif Hidayatullah Jakarta , Indonesia
  • Taufik Edy Sutanto Universitas Islam Negeri Syarif Hidayatullah Jakarta , Indonesia
  • Ary Santoso Universitas Islam Negeri Syarif Hidayatullah Jakarta , Indonesia

DOI:

https://doi.org/10.31004/jptam.v7i2.7506

Keywords:

Lda, Topik Modeling, Fully Unsupervised, Semi-Supervised, Webite Berita Online

Abstract

Masyarakat milenial tidak membutuhkan pemberitaan yang aktual dan akurat saja akan tetapi juga kecepatan pemberitaan. Media massa yang mampu dalam memenuhi kebutuhan tersebut ialah media daring. Paluposcom ialah portal berita daring yang populer saat ini di Kota Palu, Sulawesi Selatan. Berita pada portal tersebut akan terus bertambah sehingga menyebabkan semakin bertumpuknya data berita yang ada. Pemodelan topik mampu membantu mengelompokkan informasi dan juga memetakan informasi tersebut ke suatu bidang tertentu dengan menggunakan metode latent dirichlet allocation (LDA). Pada penelitian ini dilakukan dua pendekatan pemodelan topik antara metode Fully Unsupervised dan Semi Supervised. Topik yang digunakan sebagai acuan topik umum sebanyak 8 yaitu Ideologi, Politik, Ekonomi, Sosial, Budaya, Pertahanan, Keamanan dan Olahraga. Dari hasil penelitian ini diperoleh nilai loglikelihood dan coherence score Semi Supervised lebih baik dibandingkan Fully Unsupervised, serta lebih mudah diinterpretasi oleh manusia dibandingkan dengan Fully Unsupervised. Sehingga memudahkan pengguna untuk menemukan berita yang sesuai dengan minat mereka.

References

Chuang, J., Manning, C. D., & Heer, J. (2012). Termite: Visualization techniques for assessing textual topic models. In Proceedings of the international working conference on advanced visual interfaces (pp. 74-77).

Dewi, M. S. R. (2019). Islam dan etika bermedia (kajian etika komunikasi netizen di media sosial instagram dalam perspektif islam). Research Fair Unisri, 3(1).

Adimanggala, D., Bachtiar, F. A., & Setiawan, E. (2021). Evaluasi Topik Tersembunyi Berdasarkan Aspect Extraction menggunakan Pengembangan Latent Dirichlet Allocation. Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), 5(3), 511-519.

ER, N. A. S. (2021). Implementasi Latent Dirichlet Allocation (LDA) untuk Klasterisasi Cerita Berbahasa Bali. Jurnal Teknologi Informasi dan Ilmu Komputer, 8(1), 127-134

Fernanda, J. W. (2021). PEMODELAN PERSEPSI PEMBELAJARAN ONLINE MENGGUNAKAN LATENT DIRICHLET ALLOCATION. Jurnal Statistika Universitas Muhammadiyah Semarang, 9(2), 79-85.

Matira, Y., & Setiawan, I. (2023). Pemodelan Topik pada Judul Berita Online Detikcom Menggunakan Latent Dirichlet Allocation. ESTIMASI: Journal of Statistics and Its Application, 53-63.

Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent dirichlet allocation. Journal of machine Learning research, 3(Jan), 993-1022.

Stevens, K., Kegelmeyer, P., Andrzejewski, D., & Buttler, D. (2012, July). Exploring topic coherence over many models and many topics. In Proceedings of the 2012 joint conference on empirical methods in natural language processing and computational natural language learning (pp. 952-961).

Hidayatullah, A. F., Ma’arif, M. R., Habibie, M., & Khomsah, S. (2021, February). Indonesia infrastructure development topic discovery on online news with latent Dirichlet allocation. In IOP conference series: materials science and engineering (Vol. 1077, No. 1, p. 012012). IOP Publishing

Chang, J., Gerrish, S., Wang, C., Boyd-Graber, J., & Blei, D. (2009). Reading tea leaves: How humans interpret topic models. Advances in neural information processing systems, 22.

D'Andrea, E., Ducange, P., Bechini, A., Renda, A., & Marcelloni, F. (2019). Monitoring the public opinion about the vaccination topic from tweets analysis. Expert Systems with Applications, 116, 209-226

Center, K. I. (2020). Status Literasi Digital Indonesia: Survei di 34 Propinsi.

Sievert, C., & Shirley, K. (2014, June). LDAvis: A method for visualizing and interpreting topics. In Proceedings of the workshop on interactive language learning, visualization, and interfaces (pp. 63-70).

Downloads

Published

30-06-2023

How to Cite

Nurdin, K. F. ., Sutanto, T. E. ., & Santoso, A. (2023). Analisa Pemodelan Topik Berita Daring Menggunakan Semi-Supervised dan Fully Unsupervised Latent Dirichlet Allocation. Jurnal Pendidikan Tambusai, 7(2), 8043–8055. https://doi.org/10.31004/jptam.v7i2.7506

Issue

Section

Articles of Research

Citation Check