Kaba Kümeler ve Uygulamaları


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Yıldız Teknik Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2022

Tezin Dili: Türkçe

Öğrenci: AHMET TOPAL

Asıl Danışman (Eş Danışmanlı Tezler İçin): Yasemen Uçan

Eş Danışman: Nilgün Güler Bayazıt

Özet:

Çağımızda veri, yapay zekâ uygulamalarının merkezinde yer alan önemli bir bileşen haline gelmiştir.  Veriye bu derece ilginin arttığı bir ortamda hem uygulama hem de teorik seviyedeki çalışmalarda önemli artışlar yaşanmaktadır. Pawlak (1982) tarafından ortaya atılan kaba küme teorisi, ayırt edilemezlik bağıntısı temelinde veriden faydalı ve anlamlı bilgilerin elde edilmesine yönelik matematiksel bir araçtır. Gerçek dünya verilerinin deterministik bir bağlamdan uzak olup belirsizlikler içermesi bu teorinin temel motivasyon kaynağını oluşturmaktadır. Özellikle veriden karar kurallarına dayalı gizli bilgilerin çıkarılabilmesi, nitelik ve örnek seçimi, eksik veriler ile çalışabilme kabiliyetinden ötürü tercih edilmektedir. Kaba kümeler, ekonomi ve finansta, tıpta, robotik ve mühendislikte, sinyal ve görüntü işleme gibi alanlarda yaygın bir kullanıma sahiptir. Lakin klasik kaba küme teorisi öznitelik alanlarının tercih sıraları dikkate alındığında baskınlık ilkesinden kaynaklanan tutarsızlıkla başa çıkmakta yetersiz kalmaktadır. Bu sebeple çok kriterli karar verme analizi için klasik kaba küme teorisinin bir genişlemesi olarak baskın kaba küme yaklaşımı ortaya atılmıştır. Bu tez çalışması kapsamında, ilk bölümde klasik kaba kümeler ile baskın kaba kümeler üzerine literatür incelemesi yapılmıştır. Tezin amacı ve hipotez de bu bölümde sunulmuştur. İkinci bölümde klasik kaba küme yaklaşımı ile baskın kaba küme yaklaşımı hakkında bilgi verilmiştir. Üçüncü bölümde deneysel tasarım ve deneysel sonuçlara yer verilmiştir. Deneysel çalışmada “Eğer … ise …” şeklinde karar kurallarının çıkarılması ve karar verme sürecinde çıkarılan bu kuralları kullanan bir karar destek modelini tasarlamak amaçlanmıştır. Bu doğrultuda veri kümesi test ve eğitim olmak üzere iki parçaya ayrılmıştır. Eğitim kümesi üzerinden DomLem algoritması kullanılarak karar kuralları çıkarılmıştır. Bu kurallar kullanılarak test kümesindeki örneklerin her bir karar sınıfına ait olma skorları hesaplanmış ve her bir örnek en yüksek skora sahip olduğu karar sınıfına atanmıştır. Örneklerin gerçek ve tahmin edilen sınıflarını kullanarak karmaşıklık matrisi oluşturulmuştur. Bu matris yardımıyla çıkarılan karar kurallarının test kümesi üzerindeki performansı değerlendirilmiştir. Son olarak, bir örneğin karar sınıfını tayin etmek için kullanılan skor hesabının matematiksel formülasyonundan faydalanılarak veri kümesindeki bir karar sınıfı için niteliklerin optimum düzeyleri elde edilerek tablo halinde sunulmuştur