Parçacık Sürü Optimizasyonu Kullanılarak Boyutu Azaltılmış Mikrodizi Verileri Üzerinde Makine Öğrenmesi Yöntemleri ile Prostat Kanseri Teşhisi
Mikrodizi verilerine dayanan veri madenciliği analizi, hastalık teşhisi ve farmakoloji alanlarında kullanılmaktadır. Analiz aşamasında yaşanan en önemli zorluk, mikrodizilerin yüksek boyutlu olması ve çok sayıda gereksiz öznitelik içermesidir. Bu nedenle çalışmada kullandığımız prostat kanseri mikro...
Gespeichert in:
Veröffentlicht in: | Düzce Üniversitesi bilim ve teknoloji dergisi (Online) 2019-01, Vol.7 (1), p.769-777 |
---|---|
Hauptverfasser: | , , |
Format: | Artikel |
Sprache: | eng |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Mikrodizi verilerine dayanan veri madenciliği analizi, hastalık teşhisi ve farmakoloji alanlarında kullanılmaktadır.
Analiz aşamasında yaşanan en önemli zorluk, mikrodizilerin yüksek boyutlu olması ve çok sayıda gereksiz
öznitelik içermesidir. Bu nedenle çalışmada kullandığımız prostat kanseri mikrodizi veri kümesi üzerinde öznitelik
boyut azaltılması amacıyla Temel bileşenler analizi (TBA) ve Parçacık sürü optimizasyonu (PSO) kullanılmıştır.
Bu sayede hastalıkları etkileyen genler tespit edilmektedir. Boyutu azaltılmış veri kümeleri Destek Vektör
Makinesi ve k-En Yakın Komşuluk sınıflayıcı yöntemlerine giriş olarak verilmiş ve sınıflandırma başarı sonuçları
değerlendirilmiştir. Sonuç olarak PSO boyut azaltma yöntemi ile prostat kanserinde etkin genler belirlenmiş ve 50
öznitelik ile %95.77 başarı elde edilmiştir.
Data mining analysis based on microarray data is used in disease diagnosis and pharmacology. The major challenge
in the analysis phase is the high dimension of microarrays and the large number of unnecessary features. For this
reason, Principle Component Analysis (PCA) and Particle Swarm Optimization (PSO) were used to reduce the
feature dimension on the prostate cancer microarray dataset used in the study. In this way, genes that affect diseases
are determined. Dimension reduced data sets are given as input to Support Vector Machine and k-Nearest neighbor
classification methods and classification success results are evaluated. Finally, active genes in prostate cancer were
identified by PSO dimension reduction method and 95.77% success was achieved with 50 attributes. |
---|---|
ISSN: | 2148-2446 2148-2446 |
DOI: | 10.29130/dubited.464092 |