20. ULUSLARARASI EKONOMETRİ, YÖNEYLEM ARAŞTIRMASI VE İSTATİSTİK SEMPOZYUMU , Ankara, Türkiye, 12 Şubat - 14 Mart 2020, ss.18
Metin
Madenciliği Temelli Bildirim Yönetimi
Emre Rıdvan Muratlar1, Dr. Öğr. Üyesi
Doğan Yıldız2
Özet
Veri madenciliği, büyük veriler topluluğundan elde
edilmek istenilen bilgilerin keşfinde analiz ve işlemlerin yapılması sürecidir.
Bu süreçte yapısal ya da resim, ses, metin gibi yapısal olmayan veriler kullanılabilir.
Dijital dünyadaki verilerin %85’inin yapısal olmayan veriler olduğu tahmin
edilmektedir. Yazılı veriler üzerinden doğal dil işleme ve istatistik
kullanılarak metin madenciliği ile bilgi keşfi yapılmaktadır. Metin
madenciliğinin temel hedefleri metinlerin konularına göre ayrıştırılması,
özetinin çıkarılması, başlıklarının eklenmesi ve yazarlarının belirlenmesidir. Bu
amaçların bazıları için metin madenciliği yöntemleri yeterli olmakta, bazıları
için ise kümeleme, sınıflandırma gibi çalışmalar yapılmaktadır.
i-Amaç:
Kurumsal şirketlere gelen şikâyet, öneri gibi bildirimler
bildirim kayıt sistemleri ile yönetilir. Bu sistemler müşterilerden gelen
talepleri toplar ve müşteriye en kısa süre içerisinde sorunun çözümünü iletmeyi
hedefler. Amaç süreçlerin iyileştirilmesi ve müşteri memnuniyetinin artmasıdır.
Çalışmada Python programlama
dili kullanılarak bildirim yönetim sisteminde bildirimlerin hangi ekibe iletilmesi
gerektiği tahmin edilecektir.
ii-Yöntem
Sınıflama algoritmalarında en çok kullanılan yöntemlerden
biri Lojistik Regresyon ’dur. Lojistik
regresyon modeli bağımlı değişkeninin kategorik olması ve sınıflandırma
işlemleri için kullanılması ile doğrusal regresyon modellerinden ayrılır.
Lojistik regresyon analizi adını, bağımlı değişkene uygulanan logit
dönüştürmeden almaktadır. Amaç bağımlı ve bağımsız değişkenler arasındaki
ilişkiyi tanımlayabilecek bir model kurmaktır. Lojistik regresyonda bağımlı
değişkenin 1 olarak tanımlanan değerinin gerçekleşme olasılığı hesaplanır.
Şikayet ve öneri bildirimleri aşağıdaki akışa göre
gerçekleşir:
Kullanıcı, şikayet ya da önerisini email ya da ilgili
arayüz ile kuruma iletir. Gelen bildirimler veri tabanına kaydedilir. Ofis
çalışanları gelen bildirimleri doğru ekiplere iletmeye çalışır. Çok fazla ekip
ve çok fazla bildirim olmasından dolayı çoğu zaman bildirimler ilk seferde
doğru ekiplere iletilemez. Bu durum bildirim çözüm süresinin uzamasına ve
müşteri memnuniyetinin azalmasına neden olur.
Bu çalışmada, müşterilerden
gelen bildirimlerin metin madenciliği ve sınıflandırma algoritmaları ile veri
bilimi, makine öğrenimi, sistem otomasyonu, web ve API geliştirme gibi
konularda çalışılabilen Python programlama dili kullanılmıştır.
iii-Bulgular ve
Sonuç:
Yapılan çalışma ile veri tabanında tutulan veriler metin
madenciliği yöntemleri ile yapısal veriye dönüştürülmüş ve Lojistik Regresyon
algoritması ile sınıflandırılmıştır. Veri seti %70 öğrenim, %30 test olmak
üzere 2’ye bölünmüş ve modelin performansı ölçümlenmiştir. Çalışma sonunda
müşterilerden gelen bildirimler hızlı ve düşük hata oranları ile ilgili
ekiplere iletilmiştir. Bu sayede operasyonel maliyet azaltılmış, müşteri
memnuniyeti arttırılmıştır.
Anahtar Kelimeler: Metin Madenciliği, Lojistik Regresyon, Bildirim Yönetimi
Jel Kodları: C80, C38, M0