Analisis Trend Topik Penelitian pada Web Of Science dan SINTA untuk Penentuan Tema Tugas Akhir Mahasiswa AMIK Indonesia Banda Aceh
Penelitian ini mencoba melakukan penambangan dengan menggunakan teknologi web untuk mengumpulkan data informasi yang berasal dari Web of Science dan SINTA yang dikumpulkan. Metodologi Cross Industry Standard Process for Data Mining (CRISP–DM) digunakan sebagai standard proses data mining sekaligus s...
Gespeichert in:
Veröffentlicht in: | Jurnal SAINTEKOM 2020-03, Vol.10 (1), p.13 |
---|---|
Hauptverfasser: | , |
Format: | Artikel |
Sprache: | eng |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Penelitian ini mencoba melakukan penambangan dengan menggunakan teknologi web untuk mengumpulkan data informasi yang berasal dari Web of Science dan SINTA yang dikumpulkan. Metodologi Cross Industry Standard Process for Data Mining (CRISP–DM) digunakan sebagai standard proses data mining sekaligus sebagai metode penelitian. Peneliti mengumpulkan data melalui daftar jurnal Web of Science dan SINTA. Untuk melacak trend topik penelitian, peneliti memilih rentang waktu dari tahun 2018 sampai dengan 2019 dan mengekspor data dari Web of Science Core Collection pada April 2019. Ada 38.162 publikasi yang berhasil diambil di Web-Science-defined kategori Ilmu Komputer dan Sistem Informasi dan 230 diambil dari website SINTA. Tetapi, penulis hanya mengambil 20 Jurnal dengan H-Index Tertinggi di Web of Science Core Collection. Sedangkan pada SINTA, penulis juga mengambil 20 Jurnal dengan rangking SINTA 1 dan 2. penelitian ini menyimpulkan topik penelitian dalam jurnal Web of Science dan dikaitkan dengan dengan tren topik penelitian dan yang muncul terbanyak adalah learning, network, analysis, system, control, data, image, optimization, systems, dan neural. Adapun untuk klasifikasi menggunakan model Naive Bayes, Generalized Linear Model, Logistic Regression, Fast Large Margin, Deep Learning, Decision Tree, Random Forest, Gradient Boosted Trees, dan Support Vector Machine. Berdasarkan hasil akurasi, model Generalized Linear Model dan Decision Tree memiliki akurasi sebesar 94.3%, sedangkan Gradient Boosted Trees memiliki persentase akurasi sebesar 93.8%. Naive Bayes menunjukkan tingkat akurasi sebesar 91.4%, diikuti dengan model Fast Large Margin, Deep Learning, Random Forest, dan Support Vector Machine memiliki akurasi sebesar 91.4%. Nilai dengan akurasi terendah menggunakan model Logistic Regression sebesar 65.2%. Hal ini menunjukan bahwa tingkat akurasi tertinggi yaitu dengan menggunakan model Generalized Linear Model dan Decision Tree sehingga hasilnya dapat memprediksi cukup akurat. |
---|---|
ISSN: | 2088-1770 2503-3247 |
DOI: | 10.33020/saintekom.v10i1.91 |