Hipospadias olgularında inflamatuar sürecin veri madenciliği yöntemleri ile tespiti


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Yıldız Teknik Üniversitesi, Fen Bilimleri Enstitüsü, Matematik Mühendisliği, Türkiye

Tezin Onay Tarihi: 2022

Tezin Dili: Türkçe

Öğrenci: HÜLYA ACAR

Asıl Danışman (Eş Danışmanlı Tezler İçin): Birol Aslanyürek

Eş Danışman: Emrah Aydın

Özet:

Hipospadias çocuklarda görülen en yaygın genital bölge anomalilerinden biridir. Bu hastalık üretral plakada inflamasyona yol açmaktadır. Hemogramda bulunan parametreler inflamatuar süreçler hakkında bilgi verebilmektedir. Ayrıca hemogram testi uygulanabilirliği ve maliyetinin düşük olması sebebiyle yaygın bir test yöntemidir. Literatüre baktığımızda, her geçen yıl bilgisayarların verileri depolama kapasiteleri artmaktadır. Bu durum çeşitli alanlarda devasa bilgi yığınlarının oluşmasına yol açmaktadır. Bu bağlamda önde gelen alanlardan birisi de tıp sektörüdür. Günümüzde hastane veri tabanları keşfedilmeyi bekleyen birbiriyle ilişkili çok miktarda veri barındırmaktadır. Bu tezde hipospadias olgularında veri madenciliği yöntemleriyle inflamatuar süreç tespit edilmeye çalışıldı. Bunun için hastaneye sünnet operasyonu talebiyle gelmiş çocuklardan alınan veriler ile hipospadias tanısı konulmuş olguların verileri iki ayrı grupta incelenmiştir. İnflamatuar süreci ortaya koyabilmek için öznitelik olarak hemogram test sonuçları kullanılmıştır. Öncelikle her bir hemogram parametre değerinin Kolmorogov Smirnov testi aracılığıyla normal dağılıma uyup uymadığı tespit edilmiştir. Daha sonra hipospadiaslı olgularla sünnet talebiyle gelmiş çocuklar arasında Mann Whitney U testi kullanılarak anlamlı bir fark olup olmadığı incelenmiştir. İstatistiksel analiz sonrası veri madenciliği yöntemleriyle hipospadias olgularında inflamasyonu ayırt ettirecek belirteçler olup olmadığına dair sonuçlar hemogram değerleri üzerinden elde edilmiştir. Bunun için Matlab programının 'Classification Learner' (2022b) adlı aracında tanımlanmış denetimli makine öğrenmesi yöntemleri uygulanarak çeşitli modeller eğitilmiş ve test veri seti kullanılarak doğruluk oranları hesaplanmıştır. Modellerden çıkan sonuçlar karşılaştırıldığında, Medium Gaussian, Optimizable Tree ve Coarse Tree yöntemlerinin en yüksek doğruluk değerleri ile tahminleme yaptığı görülmüştür.