41. Yöneylem Araştırması Endüstri Mühendisliği Kongresi, Denizli, Turkey, 26 - 28 October 2022, pp.56
Sağlık hizmetleri; insanların, hastalık,
yaralanma gibi fiziksel ya da zihinsel rahatsızlıklarda tedavi yoluyla
sağlığının korunması ve iyileştirilmesini kapsamaktadır. Çoğu gelişmiş ülkede
sağlık hizmetleri devlet tarafından sağlanıyor olmasına rağmen Amerika Birleşik
Devletleri’nde bu hizmetler diğer ülkelerden farklı olarak yürütülmektedir.
Genel sağlık sigortası hizmetlerinin olmadığı ülkede kamu çalışanları dahil
olmak üzere tüm bireyler sağlık hizmetlerine erişebilmek için işverenleri
tarafından yapılan sigortalar kullanmak ya da özel sigorta şirketlerinden
kendilerine uygun olan sigorta paketlerini almaktadırlar. En temel sağlık
hizmetlerini kapsayacak şekilde temel ihtiyaçları karşılayan sağlık hizmetlerini
içeren paketler belirli ücretlere yapılmaktadır. Temel sağlık hizmetlerinden
başlayarak oluşturulan paketler için farklı fiyatlandırmalar yapılmaktadır. Bu
çalışma kapsamında çevrimiçi platform olan Kaggle’da yayınlanan “Amerika
Birleşik Devletleri Sağlık Sigortası” veri seti kullanılarak bireylerin sağlık
sigortalarına ödeyecekleri prim ücreti, makine öğrenmesi yöntemleri
kullanılarak tahmin edilmiştir. Bu doğrultuda gözetimli ve gözetimsiz öğrenme olmak
üzere ikiye ayrılan makine öğrenmesi tekniklerinden gözetimli öğrenme yöntemleri
içinde yer alan çoklu doğrusal regresyon, karar ağaçları ve rassal orman
yöntemleri kullanılmıştır. Çoklu doğrusal regresyon, doğrusal modellerin
oluşturulması için kullanılıyorken rassal orman ve karar ağaçları doğrusal
olmayan modellerin oluşturulmasında tercih edilmektedir. Çoklu doğrusal
regresyon, birden fazla değişken kullanılarak sürekli yapıya sahip olan tek
bağımlı değişkenin tahmin edilmesi için kullanılmaktadır. Karar ağaçları ise
bir ağaç yapısı şeklinde regresyon modellerinin oluşturulması için
kullanılmaktadır. Bu yöntemde veri seti giderek daha küçük alt kümelere
ayrılmakta ve eş zamanlı olarak karar ağacı oluşturulmaktadır. Rassal orman
yöntemi ise verinin eğitilmesi aşamasında çok sayıda karar ağacı oluşturarak
regresyon modelinin oluşturulmasına dayanmaktadır. Doğrusal ya da doğrusal
olmayan olarak tanımlanan bu yöntemlerde kullanılan algoritmalar benzer çalışma
yapısına sahiptir. Eğitim veri seti (train data set) kullanılarak model
kurulmakta sonrasında test veri seti kullanılarak modelin doğruluğu belirli
performans göstergeleri sayesinde test edilmektedir. Farklılık ise tanımlarında
da anlaşılacağı gibi model kurulmasında ortaya çıkmaktadır. Sonuçta ise mevcut
veriler ile sürekli yapıya sahip olan bağımlı değişkeni tahmin etmek için en
uygun model elde edilmektedir. Yapılan bu çalışmada oluşturulan modellerde bireylerin
ödeyeceği prim ücretlerinin tahmin edilmesinde bireylerin sağlık geçmişleri,
aile yapıları ve mevcut hastalıkları gibi faktörlerin etkili olduğu
varsayılmıştır. Yaş, cinsiyet, vücut-kütle indeksi, bireylerin sahip olduğu
çocuk sayısı, sigara içip içmeme durumu gibi farklı bağımsız değişkenler
kullanılarak oluşturulan modeller R2 ve ortalama hata karesi gibi farklı
performans ölçütlerine göre karşılaştırılmıştır. Oluşan modellerin benzer
değişkenleri içerdiği ancak performans ölçütlerine göre çıkan sonuçlarda en iyi
sonucun çoklu doğrusal regresyon ile elde edildiği gözlemlenmiştir.