Bireylerin Ödeyeceği Sağlık Sigortası Prim Ücretlerinin Tahmin Edilmesi: Amerika Birleşik Devletleri Uygulaması


Geçici E., Soner Kara S.

41. Yöneylem Araştırması Endüstri Mühendisliği Kongresi, Denizli, Türkiye, 26 - 28 Ekim 2022, ss.56

  • Yayın Türü: Bildiri / Özet Bildiri
  • Basıldığı Şehir: Denizli
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.56
  • Yıldız Teknik Üniversitesi Adresli: Evet

Özet

Sağlık hizmetleri; insanların, hastalık, yaralanma gibi fiziksel ya da zihinsel rahatsızlıklarda tedavi yoluyla sağlığının korunması ve iyileştirilmesini kapsamaktadır. Çoğu gelişmiş ülkede sağlık hizmetleri devlet tarafından sağlanıyor olmasına rağmen Amerika Birleşik Devletleri’nde bu hizmetler diğer ülkelerden farklı olarak yürütülmektedir. Genel sağlık sigortası hizmetlerinin olmadığı ülkede kamu çalışanları dahil olmak üzere tüm bireyler sağlık hizmetlerine erişebilmek için işverenleri tarafından yapılan sigortalar kullanmak ya da özel sigorta şirketlerinden kendilerine uygun olan sigorta paketlerini almaktadırlar. En temel sağlık hizmetlerini kapsayacak şekilde temel ihtiyaçları karşılayan sağlık hizmetlerini içeren paketler belirli ücretlere yapılmaktadır. Temel sağlık hizmetlerinden başlayarak oluşturulan paketler için farklı fiyatlandırmalar yapılmaktadır. Bu çalışma kapsamında çevrimiçi platform olan Kaggle’da yayınlanan “Amerika Birleşik Devletleri Sağlık Sigortası” veri seti kullanılarak bireylerin sağlık sigortalarına ödeyecekleri prim ücreti, makine öğrenmesi yöntemleri kullanılarak tahmin edilmiştir. Bu doğrultuda gözetimli ve gözetimsiz öğrenme olmak üzere ikiye ayrılan makine öğrenmesi tekniklerinden gözetimli öğrenme yöntemleri içinde yer alan çoklu doğrusal regresyon, karar ağaçları ve rassal orman yöntemleri kullanılmıştır. Çoklu doğrusal regresyon, doğrusal modellerin oluşturulması için kullanılıyorken rassal orman ve karar ağaçları doğrusal olmayan modellerin oluşturulmasında tercih edilmektedir. Çoklu doğrusal regresyon, birden fazla değişken kullanılarak sürekli yapıya sahip olan tek bağımlı değişkenin tahmin edilmesi için kullanılmaktadır. Karar ağaçları ise bir ağaç yapısı şeklinde regresyon modellerinin oluşturulması için kullanılmaktadır. Bu yöntemde veri seti giderek daha küçük alt kümelere ayrılmakta ve eş zamanlı olarak karar ağacı oluşturulmaktadır. Rassal orman yöntemi ise verinin eğitilmesi aşamasında çok sayıda karar ağacı oluşturarak regresyon modelinin oluşturulmasına dayanmaktadır. Doğrusal ya da doğrusal olmayan olarak tanımlanan bu yöntemlerde kullanılan algoritmalar benzer çalışma yapısına sahiptir. Eğitim veri seti (train data set) kullanılarak model kurulmakta sonrasında test veri seti kullanılarak modelin doğruluğu belirli performans göstergeleri sayesinde test edilmektedir. Farklılık ise tanımlarında da anlaşılacağı gibi model kurulmasında ortaya çıkmaktadır. Sonuçta ise mevcut veriler ile sürekli yapıya sahip olan bağımlı değişkeni tahmin etmek için en uygun model elde edilmektedir. Yapılan bu çalışmada oluşturulan modellerde bireylerin ödeyeceği prim ücretlerinin tahmin edilmesinde bireylerin sağlık geçmişleri, aile yapıları ve mevcut hastalıkları gibi faktörlerin etkili olduğu varsayılmıştır. Yaş, cinsiyet, vücut-kütle indeksi, bireylerin sahip olduğu çocuk sayısı, sigara içip içmeme durumu gibi farklı bağımsız değişkenler kullanılarak oluşturulan modeller R2 ve ortalama hata karesi gibi farklı performans ölçütlerine göre karşılaştırılmıştır. Oluşan modellerin benzer değişkenleri içerdiği ancak performans ölçütlerine göre çıkan sonuçlarda en iyi sonucun çoklu doğrusal regresyon ile elde edildiği gözlemlenmiştir.