[PENELITIAN] [2018] PEMBANGUNAN SUBSISTEM PERINGKASAN MULTI DOKUMEN BAHASA INDONESIA DENGAN METODE RELEVANCE LATENT DIRICHLET ALLOCATION

[PENELITIAN] [2018] PEMBANGUNAN SUBSISTEM PERINGKASAN MULTI DOKUMEN BAHASA INDONESIA DENGAN METODE RELEVANCE LATENT DIRICHLET ALLOCATION

Mesin pencarian informasi yang ada sampai saat ini masih belum mampu memenuhi kebutuhan pengguna sistem terhadap hasil pencarian yang didapatkan. Dari sisi waktu, pengguna harus menyediakan banyak waktu untuk memilah-milah informasi yang ada dari website yang ditampilkan. Dari sisi kualitas informasi, pengguna harus menggabungkan sendiri seluruh informasi yang diperoleh dari dokumen-dokumen yang berbeda. Keterbatasan teknologi mesin pencarian informasi ini membutuhkan sistem ringkasan multi dokumen otomatis yang memudahkan pengguna memperoleh informasi yang merupakan gabungan dari informasi-informasi yang saling berhubungan dari beberapa dokumen pada website yang berbeda. Saat ini, ringkasan multi dokumen secara umum cenderung mengarah pada penggunaan model topik dan teknik pembelajaran mesin. Berdasarkan penelitian sebelumnya, penggunaan metode Latent Dirichlet Allocation sebagai model topik menunjukkan hasil yang lebih baik daripada Bag-of-Words dan penggunaan teknik unsupervised learning menunjukkan kinerja yang lebih baik daripada teknik supervised learning. Sampai saat ini, sejauh yang diketahui penulis, belum ada penelitian yang membangun ringkasan multi dokumen berbasis topik untuk dokumen Bahasa Indonesia dengan metode penalaran Fuzzy dan Gibbs Sampling Latent Dirichlet Allocation untuk melakukan ekstraksi fitur dokumen dan query, kemudian mengelompokan dokumen dengan metode Gibbs Sampling Latent Dirichlet Allocation dan Hierarchy Agglomerative Clustering, serta membuat ringkasan multi dokumen dengan metode Latent Dirichlet Allocation dan Maximal Marginal Relevance. Pada penelitian ini dilakukan pembangunan subsistem peringkasan multi dokumen Bahasa Indonesia dengan metode Relevance Latent Dirichlet Allocation, sebagai bagian dari penelitian disertasi yang berjudul Ringkasan Multi Dokumen Bahasa Indonesia Berbasis Topik dengan Fuzzy Gibbs Hierarchy Relevance Latent Dirichlet Allocation dengan target kelulusan pada tahun 2019. Tujuan pembangunan subsistem ini adalah menghasilkan sistem ringkasan multi dokumen otomatis yang memudahkan pengguna dalam menemukan dokumen yang sesuai dengan kebutuhannya, karena tidak harus membuka dokumen yang dihasilkan oleh mesin pencarian informasi satu per satu, serta kemudahan dalam memperoleh informasi yang lebih informatif, karena sistem memproses pertanyaan dan jawaban dengan merangkumnya dari beberapa dokumen sumber. Untuk mencapai tujuan tersebut, pembangunan subsistem peringkasan multi dokumen ini dilakukan dengan menganalisis kebutuhan sistem, menerjemahkannya kedalam bentuk algoritma, membuat antarmuka sistem, membuat program dan melakukan pengujian. Hasil dari penelitian ini berupa sistem ringkasan multi dokumen otomatis berbasis computer. Luaran wajib yang diharapkan adalah publikasi melalui jurnal internasional bereputasi, dengan luaran tambahan berupa pendaftaran hak cipta atas program komputer.

Social Share :