Çocuklarda İnguinal Bölge Hastalıklarının Kan Değerlerinden Hareketle Veri Madenciliği Yardımıyla Tahminlenmesi


Creative Commons License

Acar H., Aslanyürek B., Aydın E.

2nd International Graduate Studies Congress, Balıkesir, Türkiye, 8 - 11 Haziran 2022, ss.890-891

  • Yayın Türü: Bildiri / Özet Bildiri
  • Basıldığı Şehir: Balıkesir
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.890-891
  • Yıldız Teknik Üniversitesi Adresli: Evet

Özet

Çocuk cerrahisinde operasyon gerektiren hastalıklar en fazla inguinal bölge ile alakalı
olmaktadır. Hidrosel, inguinal herni ve inmemiş testis inguinal bölge hastalıklarının başında
gelmektedir. Bu hastalıklara sahip çocuklar benzer şikayetlere sahip olduğu
gözlemlenmektedir. Bu şikayetler doğrultusunda toplanan veriler, veri bilimi alanında da
kullanılmaktadır.
Veri madenciliği çeşitli algoritmik yöntemler aracılığıyla veriler arası ilişkileri tespit ederek
karşılaşılan probleme göre tahminleme yapılması imkân vermektedir. Her geçen yıl
teknolojinin gelişmesi ile birlikte bilgisayarların veri depolama kapasiteleri artmakta ve büyük
miktarda veriler depolanabilmektedir. Veri madenciliği bu muazzam miktardaki verilerden
çeşitli analizler yaparak veri içerisinden keşfedilmemiş örüntü ve bağlantıları tespit eder ve
karar verme mekanizmasına katkı sağlar. Tahmin edileceği üzere en fazla veriye sahip
alanlardan birisi de sağlık sektörüdür. Her geçen gün binlerce hastanın farklı türden verileri
kayıt altına alınmaktadır. Veri madenciliği bu çeşitli verilerden anlamlı sonuçlar elde ederek
hastalıkların teşhis sürecinde devrim niteliğinde fayda sağlamaya başlamıştır.
Bu çalışma ile hastaların hemogram testi sonuçlarının denetimli makine öğrenmesi
yöntemleri aracılığıyla analiz edilip yukarıda adı geçen bu üç hastalığın birbirinden ayrılması
amaçlanmaktır. Bunun için çocuk cerrahisi bölümünden alınmış 15.533 hasta verisi arasından
2.871 hastanın laboratuvar sonuçları kullanılmıştır. Veri setinden aykırı değerler tespit edilerek
çıkartılmış ve MATLAB programı aracılığıyla makine öğrenmesi teknikleri uygulanmıştır.
Verilerin %30’u test için ayrılırken %70’i makine öğrenmesi modellerinin eğitimi için
kullanılmışkulanğitim aşamasında 10 katlamalı çapraz doğrulama tekniği kullanılmıştır.
Veri madenciliğinde farklı modellerden çıkan sonuçlar karşılaştırılarak optimum sonuç
veren modeller belirlenmiştir. Bu çalışma ile tespit edilmiş modeller göz önünde
bulundurularak ilgili hastalıklarla alakalı diğer çalışmalara ışık tutulması ümit edilmektedir.

Diseases requiring surgery in pediatric surgery are most relevant to the inguinal region.
Hydrocele, inguinal hernia and undescended testicle are the leading diseases of the inguinal
region. Children with these diseases have similar complaints. The data collected in accordance
with these complaints are also used in the field of data science.
Data mining by Deciphering the relationships between the data through various algorithmic
methods, it is possible to make predictions according to the problem encountered. With the
development of technology every year, the data storage capacity of computers is increasing.
But what is valuable is to get meaningful purpose-oriented information from these data piles.
Data mining methods contribute to the decision-making mechanism by performing various
analyzes from this enormous amount of data and detecting unexplored patterns and connections
in the data. Predictably, one of the areas with the most data is the health sector. Every day,
thousands of different kinds of data of patients are recorded. Data mining has started to provide
revolutionary benefits in the process of diagnosing diseases by obtaining meaningful results
from these various data.
With this study, it is aimed to analyze the hemogram test results of the patients through data
mining methods and to distinguish these three diseases mentioned above from each other. For
this purpose, 2.871 patients had laboratory results. It is determined by the SQL program and
edited in the corresponding Microsoft Excel program. Outliers were detected and removed from
the data set. Machine learning techniques were applied through the MATLAB program. %30
of the data is reserved for testing and %70 of the data was used for training machine learning
models. 10-fold cross-validation technique was used in the training phase.
By comparing the results obtained from different models in data mining, models that give
optimal results were determined. It is hoped that this study will shed light on other studies
related to related diseases by considering the models identified with this study.