Parçacık Sürü Optimizasyonu Kullanılarak Boyutu Azaltılmış Mikrodizi Verileri Üzerinde Makine Öğrenmesi Yöntemleri ile Prostat Kanseri Teşhisi

Mikrodizi verilerine dayanan veri madenciliği analizi, hastalık teşhisi ve farmakoloji alanlarında kullanılmaktadır. Analiz aşamasında yaşanan en önemli zorluk, mikrodizilerin yüksek boyutlu olması ve çok sayıda gereksiz öznitelik içermesidir. Bu nedenle çalışmada kullandığımız prostat kanseri mikro...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Düzce Üniversitesi bilim ve teknoloji dergisi (Online) 2019-01, Vol.7 (1), p.769-777
Hauptverfasser: KILIÇARSLAN, Serhat, ADEM, Kemal, CÖMERT, Onur
Format: Artikel
Sprache:eng
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Mikrodizi verilerine dayanan veri madenciliği analizi, hastalık teşhisi ve farmakoloji alanlarında kullanılmaktadır. Analiz aşamasında yaşanan en önemli zorluk, mikrodizilerin yüksek boyutlu olması ve çok sayıda gereksiz öznitelik içermesidir. Bu nedenle çalışmada kullandığımız prostat kanseri mikrodizi veri kümesi üzerinde öznitelik boyut azaltılması amacıyla Temel bileşenler analizi (TBA) ve Parçacık sürü optimizasyonu (PSO) kullanılmıştır. Bu sayede hastalıkları etkileyen genler tespit edilmektedir. Boyutu azaltılmış veri kümeleri Destek Vektör Makinesi ve k-En Yakın Komşuluk sınıflayıcı yöntemlerine giriş olarak verilmiş ve sınıflandırma başarı sonuçları değerlendirilmiştir. Sonuç olarak PSO boyut azaltma yöntemi ile prostat kanserinde etkin genler belirlenmiş ve 50 öznitelik ile %95.77 başarı elde edilmiştir.  Data mining analysis based on microarray data is used in disease diagnosis and pharmacology. The major challenge in the analysis phase is the high dimension of microarrays and the large number of unnecessary features. For this reason, Principle Component Analysis (PCA) and Particle Swarm Optimization (PSO) were used to reduce the feature dimension on the prostate cancer microarray dataset used in the study. In this way, genes that affect diseases are determined. Dimension reduced data sets are given as input to Support Vector Machine and k-Nearest neighbor classification methods and classification success results are evaluated. Finally, active genes in prostate cancer were identified by PSO dimension reduction method and 95.77% success was achieved with 50 attributes. 
ISSN:2148-2446
2148-2446
DOI:10.29130/dubited.464092