PENGELOMPOKAN DOKUMEN (DOCUMENT CLUSTERING) DENGAN MENGGUNAKAN K-MEANS DAN SINGULAR VALUE DECOMPOSITION (SVD) PADA DATA BLOG | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

PENGELOMPOKAN DOKUMEN (DOCUMENT CLUSTERING) DENGAN MENGGUNAKAN K-MEANS DAN SINGULAR VALUE DECOMPOSITION (SVD) PADA DATA BLOG


Pengarang

Munzir Umran - Personal Name;

Dosen Pembimbing



Nomor Pokok Mahasiswa

0508101010010

Fakultas & Prodi

Fakultas KIP / Pendidikan Matematika (S1) / PDDIKTI : 84202

Penerbit

Banda Aceh : Fakultas Matematika dan Ilmu Pengetahuan Alam., 2010

Bahasa

Indonesia

No Classification

519.533

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Peningkatan jumlah dokumen dalam format teks yang cukup signifikan belakangan ini, seperti blogs dan website, membuat proses pengelompokan dokumen (document clustering) menjadi semakin penting. Pengelompokan dokumen bertujuan membagi dokumen dalam beberapa kelompok (cluster) sedemikian hingga dokumen-dokumen dalam kelompok yang sarna (intra-cluster) memiliki derajat kesamaan yang tinggi, sementara dokumen-dokumen dalam kelompok yang berbeda (inter-cluster) memiliki derajat kesamaan yang rendah. Tulisan ini mendiskusikan dan memperlihatkan metode pengelompokan dokurnen yang dimulai dengan membangun matriks terms- documents A dan kemudian memecahnya menjadi tiga matriks TSD menggunakan Singular Value Decomposition (SVD). T adalah matriks kata (terms) berukuran t x r, S adalah matriks diagonal berisi nilai skalar (eigen values) berdimensi r x r, dan r ditentukan sebelumnya, D adalah matriks dokumen berukuran r x d. Dekomposisi
nilai singular dari matriks A dinyatakan sebagai A = TSDT.Penelitian dilakukan menggunakan data blog dan dekomposisi matrik menggunakan program General Text Parser (GTP) yang memuat implementasi SVD didalamnya. Selanjutnya,pengelompokan dokumen dilakukan menggunakan k-means dengan k=3,S, dan 7. Hasil menunjukkan babwa dekomposisi matrik terms-documents A dengan Singular Value Decomposion dapat mempercepat proses pengelompokan dokumen karena dimensi dari setiap vektor telah diperkecil tanpa mengurangi arti sebenamya. Namun, karena metode pengelompokan yang digunakan adalab k-means maka hasil pengelompokan sangat sensitif terhadap dokumen yang diduga sebagai outlier. Hasil penelitian, dimensi yang tepat untuk k=3 adalab dimensi 300 dengan persentase optimalnya 100% dan di k=S adalah dimensi 400 dengan persentase optimalnya berada dibatas bawab dari penetapan threshold yaitu 80%. Sedangkan untuk k=7 tidak ada dimensi yang menunjukkan hasil yang bagus karena dari semua dimensi data yang digunakan tidak ada satu pun yang mencukupi batas minimal threshold.


Keywords : Pengelompokan dokumen; Singular Value Decomposition, k-means

















Tidak Tersedia Deskripsi

Citation



    SERVICES DESK