Literatur Review: Implementasi Metode dan Dataset pada Data Mining
Keywords:
Data mining, Data mining methods, DatasetsAbstract
Abstract
Data mining is a rapidly growing field with wide applications across various sectors. Through an SLR approach, this research identifies, analyzes, and synthesizes relevant studies to provide a comprehensive overview of the techniques used and the datasets frequently applied. The research findings reveal the latest trends in algorithm usage, the advantages and disadvantages of applied algorithms, and the types of datasets most commonly used in data mining research. These findings are expected to guide researchers and practitioners in selecting appropriate methods, algorithms, and datasets for future data mining projects. The results of this literature review address the research questions posed, identifying eight algorithms used in the reviewed studies: Convolutional Neural Networks (CNN), K-Means, FP-Growth, K-Nearest Neighbors (KNN), Naive Bayes, Apriori Algorithm, Hierarchical, and C4.5. The most frequently used method/algorithm in the reviewed journals is K-Means, and the most commonly used dataset in the studied journals is the transaction dataset.
Abstrak
Data mining adalah bidang yang berkembang pesat dengan aplikasi yang luas di berbagai sektor. Melalui pendekatan SLR, penelitian ini mengidentifikasi, menganalisis, dan mensintesis studi-studi relevan untuk memberikan gambaran menyeluruh tentang teknik-teknik yang digunakan serta dataset yang sering diaplikasikan. Hasil penelitian mengungkap tren terbaru dalam penggunaan algoritma, kelebihan dan kekurangan algoritma yang diterapkan, serta jenis dataset yang paling umum digunakan dalam penelitian data mining. Temuan ini diharapkan dapat memberikan panduan kepada para peneliti dan praktisi dalam memilih metode atau algoritma dan dataset yang tepat untuk proyek-proyek data mining di masa depan. Hasil pada literature review ini adalah pembahasan dari research question yang dibuat, yaitu algoritma yang digunakan dalam penilitian yang direview ada 8 antara lain Convolutional Neural Networks (CNN), K-Means, FP-Growth, K-Nearest Neighbors (KNN), Naive Bayes, Algoritma Apriori, Hirarki, C4.5. metode/ algoritma yang sering digunakan dalam jurnal yang direcview adalah k-means, serta data set yang sering digunakan pada jurnal yang diteliti adalah dataset transaksi.