Pengelompokan Algoritma K-Medoids Dengan Principal Component Analysis (PCA) (Studi Kasus : Kabupaten/Kota di Pulau Kalimantan Berdasarkan Indikator Kemiskinan Tahun 2021)
Abstract
Analisis klaster adalah salah satu teknik yang dikenal dalam data mining yaitu sebuah metode yang bertujuan untuk mengelompokkan data (objek) berdasarkan informasi dalam data. Penelitian ini menggunakan pengelompokan non-hierarki yaitu algoritma K-Medoids untuk mengelompokkan Kabupaten/kota di Pulau Kalimantan berdasarkan indikator kemiskinan dan metode Principal Component Analysis (PCA) untuk mereduksi variabel penelitian. Pada penelitian ini juga dilakukan uji validitas klaster untuk melihat berapa jumlah klaster yang memiliki pengelompokan terbaik menggunakan metode Silhouette Coefficient (SC). Berdasarkan hasil analisis diketahui bahwa data direduksi menjadi sebanyak 3 Principal Component (PC) dengan menggunakan metode PCA dan didapatkan hasil pengelompokan Kabupaten/kota di Pulau Kalimantan berdasarkan indikator kemiskinan menggunakan algoritma K-Medoids yang paling optimal adalah dengan klaster sebanyak 2 dan nilai SC sebesar 0,612. Algoritma K-Medoids menghasilkan 2 klaster, di mana klaster 1 beranggotakan 49 Kabupaten/kota dan klaster 2 beranggotakan 7 Kabupaten/kota.
Kata Kunci: Kemiskinan, Klaster, K-Medoids, PCA, Silhouette Coefficient
References
[2] Prasetyo, E., (2012), Data Mining: Konsep Dan Aplikasi Menggunakan MATLAB, Yogyakarta: Penerbit ANDI.
[3] Singh, N dan Singh, D., (2012), Peformance evaluation of K-means and Heirarichal clustering in terms of accuracy and running time. International journal in computer science and information technology, Vol. 3, Hal. 4119-4121.
[4] Umar, H. B., (2009), Principal Component Analysis (PCA) Dan Aplikasinya Dengan SPSS. Jurnal kesehatan. Vol. 3, No. 2, Hal. 97-101.
[5] Smith, L. I., (2002), A Tutorial on Principal Component Analysis. Computer Science Technical Report, Vol. 1, No. 2, Hal. 1-26.
[6] Nasution, M. Z., (2019), Penerapan Principal Component Analysis (PCA) Dalam Penentuan Faktor Dominan yang Mempengaruhi Prestasi Belajar Siswa. Jurnal Teknologi Informasi. Vol. 3, No. 1, Hal. 41–48.
[7] Pramana, S., Yuniarto, B., Mariyah, S., Santoso, I., Nooraeni, R., (2018). Data Mining dengan R: Konsep serta Implementasi. Bogor: IN MEDIA.
[8] Ghaisani, S. Y., Hikmah, N., Prasetyo, A. H., Widodo, E., (2018), Analisis Cluster Hirarki Untuk Pengelompokan Provinsi Di Indonesia Berdasarkan Indikator Demokrasi Indonesia Tahun 2016. Konferensi Nasional Penelitian Matematika dan Pembelajarannya (KNPMP) IV, Surakarta, 2019.
[9] Mohammed, N. N., dan Abdulazeez, A. M., (2007), Evaluation of partitioning around medoids algorithm with various distances on microarray data," in IEEE International Conference on Internet of Things (iThings), Exeter, UK, pp. 1011-1016. doi: 10.1109/iThings- GreenCom-CPSCom-SmartData.2017.155
[10] Kaufman, L. dan Rousseeuw, P. J., (1990), Finding Groups in Data: An Introduction to Cluster Analysis. John Wiley and Sons, New York.
[11] Pramesti, D. F., Furqon, M. T., dan Dewi, C., (2017), Implementasi Metode K-Medoids Clustering Untuk Pengelompokan Data Potensi Kebakaran Hutan/Lahan Berdasarkan Persebaran Titik Panas (Hotspot). Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-ISSN, 2548, 964X.Y. Vol. 1, No. 9, Hal. 723-732.