Convolutional Neural Network Approach to Predict Tumor Samples Using Gene Expression Data


Creative Commons License

Darendeli B., Yılmaz A.

International Journal of Intelligent Systems and Applications in Engineering, vol.4, no.2, pp.136-141, 2021 (Other Refereed National Journals)

  • Publication Type: Article / Article
  • Volume: 4 Issue: 2
  • Publication Date: 2021
  • Doi Number: 10.38016/jista.946954
  • Journal Name: International Journal of Intelligent Systems and Applications in Engineering
  • Journal Indexes: Scopus, TR DİZİN (ULAKBİM)
  • Page Numbers: pp.136-141

Abstract

Cancer is threatening millions of people each year and its early diagnosis is still a challenging task. Early diagnosis is one of the major
ways to tackle the disease and lower the mortality rate. Advancements in deep learning approaches and the availability of biological
data offer applications that can facilitate the diagnosis and characterization of cancer. Here, we aimed to provide a new perspective of
cancer diagnosis using a deep learning approach on gene expression data.

In this study, RNA-Seq data of approximately 30 different types of cancer patients the Cancer Genome Atlas (TCGA) study, and
normal tissue RNA-Seq data from GTEx were used. The input data for the training was transformed to RGB format and the training
was carried out with a Convolutional Neural Network (CNN). The trained algorithm is able to predict cancer with 97% accuracy, using
gene expression data. In conclusion, our study shows that the deep learning approach and biological data have a huge potential in the
diagnosis and identification of tumor samples.

Kanser her yıl milyonlarca insanı tehdit eden, erken teşhisi hala mümkün olmayan yaygın bir hastalıktır. Erken teşhis, kanserle baş
etmenin ve ölüm oranını düşürmenin en önemli yollarından biridir. Derin öğrenme yaklaşımlarındaki gelişmeler ve biyolojik
verilerdeki artış, kanserin teşhisini ve karakterizasyonunu kolaylaştırabilecek uygulamalar sunmaktadır. Bu çalışmada, gen ifade
verilerini kullanarak derin öğrenme yaklaşımı ile kanser teşhisine yeni bir bakış açısı sağlamayı amaçladık.

30 farklı kanser çeşidine ait RNA-Seq verisi Kanser Genom Atlası (TCGA) adlı kaynaktan normal dokuların RNA-Seq verileri GTEx
adlı kaynaktan temin edilip model eğitiminde kullanılmıştır. Gen ifade verileri RGB formatına dönüştürülüp Konvolusyonel Sinir Ağı
(CNN) eğitimi için kullanıldı. Eğitilen model, gen ifade verilerine dayanarak kanseri %97 doğrulukla tahmin edebilmektedir. Sonuç
olarak çalışmamız, derin öğrenme yaklaşımının ve biyolojik verilerin tümör örneklerinin tanısında büyük bir potansiyele sahip
olduğunu göstermektedir.