Convolutional Neural Network Approach to Predict Tumor Samples Using Gene Expression Data


Creative Commons License

DARENDELİ KİRAZ B. N., YILMAZ A.

Zeki sistemler teori ve uygulamaları dergisi (Online), cilt.4, sa.2, ss.136-141, 2021 (Hakemli Dergi) identifier

Özet

Kanser her yıl milyonlarca insanı tehdit eden, erken teşhisi hala mümkün olmayan yaygın bir hastalıktır. Erken teşhis, kanserle baş
etmenin ve ölüm oranını düşürmenin en önemli yollarından biridir. Derin öğrenme yaklaşımlarındaki gelişmeler ve biyolojik
verilerdeki artış, kanserin teşhisini ve karakterizasyonunu kolaylaştırabilecek uygulamalar sunmaktadır. Bu çalışmada, gen ifade
verilerini kullanarak derin öğrenme yaklaşımı ile kanser teşhisine yeni bir bakış açısı sağlamayı amaçladık.

30 farklı kanser çeşidine ait RNA-Seq verisi Kanser Genom Atlası (TCGA) adlı kaynaktan normal dokuların RNA-Seq verileri GTEx
adlı kaynaktan temin edilip model eğitiminde kullanılmıştır. Gen ifade verileri RGB formatına dönüştürülüp Konvolusyonel Sinir Ağı
(CNN) eğitimi için kullanıldı. Eğitilen model, gen ifade verilerine dayanarak kanseri %97 doğrulukla tahmin edebilmektedir. Sonuç
olarak çalışmamız, derin öğrenme yaklaşımının ve biyolojik verilerin tümör örneklerinin tanısında büyük bir potansiyele sahip
olduğunu göstermektedir.


Cancer is threatening millions of people each year and its early diagnosis is still a challenging task. Early diagnosis is one of the major
ways to tackle the disease and lower the mortality rate. Advancements in deep learning approaches and the availability of biological
data offer applications that can facilitate the diagnosis and characterization of cancer. Here, we aimed to provide a new perspective of
cancer diagnosis using a deep learning approach on gene expression data.

In this study, RNA-Seq data of approximately 30 different types of cancer patients the Cancer Genome Atlas (TCGA) study, and
normal tissue RNA-Seq data from GTEx were used. The input data for the training was transformed to RGB format and the training
was carried out with a Convolutional Neural Network (CNN). The trained algorithm is able to predict cancer with 97% accuracy, using
gene expression data. In conclusion, our study shows that the deep learning approach and biological data have a huge potential in the
diagnosis and identification of tumor samples.