Ağ Çıkarım Algoritmalarındaki İlişki Tahmincilerinin Meme Kanseri Proteomik Verileri Üzerinde İncelenmesi


Erdoğan C., KURT Z. , DİRİ B.

IEEE 25. Sinyal İşleme ve İletişim Uygulamaları Kurultayı, Antalya, Türkiye, 15 Mayıs 2017, ss.1-5

  • Basıldığı Şehir: Antalya
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.1-5

Özet

Bu çalışmada kadınlarda en sık görülen kanser türü olan meme kanseri proteomik verileri kullanılarak hastalıkla ilişkili moleküler etkileşimlerin tespitinde kullanılan ağ çıkarım yöntemlerinde uygulanan ilişki tahmincileri incelenmiş ve hastalıkla ilişkili gen-gen etkileşim ağındaki hub genler bulunmaya çalışılmıştır. Veri seti olarak The Cancer Proteome Atlas (TCPA) tarafından ters faz protein dizileme yöntemi kullanılarak oluşturulmuş olan 901 göğüs kanseri hastasına ait proteomik verileri kullanılmıştır. Yapılan çalışmada literatürde yaygın olarak kullanılan korelasyon ve karşılıklı bilgi (KB) tabanlı ilişki tahmincileri karşılaştırılmış olup bunun için WGCNA ve minet R paketleri kullanılmıştır. Sonuç olarak WGCNA paketinde biyolojik ağların kestiriminde kullanılan Pearson korelasyonu tabanlı adjacency fonksiyonuna göre KB tabanlı shrink ilişki tahminci yönteminin daha başarılı sonuçlar verdiği görülmüştür. Başarım oranları farklı modül sayıları için adjacency fonksiyonunda 0.33-0.86 aralığında olurken shrink kestiriminde 0.67-1.00 aralığında olmuştur. Ayrıca başarılı bulunan sonuçlara ait hub genler

Abstract— In this study, association estimators applied in the network inference methods used to determine disease-related molecular interactions using breast cancer, which is the most common type of cancer in women, proteomic data were examined and hub genes in the gene-gene interaction network related to the disease were identified. Proteomic data of 901 breast cancer patients were generated using reverse phase protein array provided by The Cancer Proteome Atlas (TCPA) as a data set. Correlations and mutual information (MI) based estimators used in the literature were compared in the study, and WGCNA and minet R packages were used. As a result, it is seen that the MI based shrink estimator method has more successful results than the correlation-based adjacency function used in the estimation of biological networks in the WGCNA package. Achievement rates have ranged from 0.67 to 1.00 in the shrink estimation, with adjacency functions ranging from 0.33 to 0.86 for different module counts. In addition, hub genes and inferenced networks of successful results are presented for the review of biologists. Keywords— association estimators; network inference; proteomic; breast cancer.