Metin Madenciliği Temelli Bildirim Yönetimi


Creative Commons License

Yıldız D. , Muratlar E. R.

20. ULUSLARARASI EKONOMETRİ, YÖNEYLEM ARAŞTIRMASI VE İSTATİSTİK SEMPOZYUMU , Ankara, Türkiye, 12 Şubat - 14 Mart 2020, ss.18

  • Basıldığı Şehir: Ankara
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.18

Özet

Metin Madenciliği Temelli Bildirim Yönetimi

Emre Rıdvan Muratlar1,    Dr. Öğr. Üyesi Doğan Yıldız2

 

Özet

Veri madenciliği, büyük veriler topluluğundan elde edilmek istenilen bilgilerin keşfinde analiz ve işlemlerin yapılması sürecidir. Bu süreçte yapısal ya da resim, ses, metin gibi yapısal olmayan veriler kullanılabilir. Dijital dünyadaki verilerin %85’inin yapısal olmayan veriler olduğu tahmin edilmektedir. Yazılı veriler üzerinden doğal dil işleme ve istatistik kullanılarak metin madenciliği ile bilgi keşfi yapılmaktadır. Metin madenciliğinin temel hedefleri metinlerin konularına göre ayrıştırılması, özetinin çıkarılması, başlıklarının eklenmesi ve yazarlarının belirlenmesidir. Bu amaçların bazıları için metin madenciliği yöntemleri yeterli olmakta, bazıları için ise kümeleme, sınıflandırma gibi çalışmalar yapılmaktadır.

i-Amaç:

Kurumsal şirketlere gelen şikâyet, öneri gibi bildirimler bildirim kayıt sistemleri ile yönetilir. Bu sistemler müşterilerden gelen talepleri toplar ve müşteriye en kısa süre içerisinde sorunun çözümünü iletmeyi hedefler. Amaç süreçlerin iyileştirilmesi ve müşteri memnuniyetinin artmasıdır. Çalışmada Python programlama dili kullanılarak bildirim yönetim sisteminde bildirimlerin hangi ekibe iletilmesi gerektiği tahmin edilecektir.

ii-Yöntem

Sınıflama algoritmalarında en çok kullanılan yöntemlerden biri Lojistik Regresyon ’dur.  Lojistik regresyon modeli bağımlı değişkeninin kategorik olması ve sınıflandırma işlemleri için kullanılması ile doğrusal regresyon modellerinden ayrılır. Lojistik regresyon analizi adını, bağımlı değişkene uygulanan logit dönüştürmeden almaktadır. Amaç bağımlı ve bağımsız değişkenler arasındaki ilişkiyi tanımlayabilecek bir model kurmaktır. Lojistik regresyonda bağımlı değişkenin 1 olarak tanımlanan değerinin gerçekleşme olasılığı hesaplanır.

Şikayet ve öneri bildirimleri aşağıdaki akışa göre gerçekleşir:

Kullanıcı, şikayet ya da önerisini email ya da ilgili arayüz ile kuruma iletir. Gelen bildirimler veri tabanına kaydedilir. Ofis çalışanları gelen bildirimleri doğru ekiplere iletmeye çalışır. Çok fazla ekip ve çok fazla bildirim olmasından dolayı çoğu zaman bildirimler ilk seferde doğru ekiplere iletilemez. Bu durum bildirim çözüm süresinin uzamasına ve müşteri memnuniyetinin azalmasına neden olur.

Bu çalışmada, müşterilerden gelen bildirimlerin metin madenciliği ve sınıflandırma algoritmaları ile veri bilimi, makine öğrenimi, sistem otomasyonu, web ve API geliştirme gibi konularda çalışılabilen Python programlama dili kullanılmıştır.

iii-Bulgular ve Sonuç:

Yapılan çalışma ile veri tabanında tutulan veriler metin madenciliği yöntemleri ile yapısal veriye dönüştürülmüş ve Lojistik Regresyon algoritması ile sınıflandırılmıştır. Veri seti %70 öğrenim, %30 test olmak üzere 2’ye bölünmüş ve modelin performansı ölçümlenmiştir. Çalışma sonunda müşterilerden gelen bildirimler hızlı ve düşük hata oranları ile ilgili ekiplere iletilmiştir. Bu sayede operasyonel maliyet azaltılmış, müşteri memnuniyeti arttırılmıştır.

 

Anahtar Kelimeler: Metin Madenciliği, Lojistik Regresyon, Bildirim Yönetimi

Jel Kodları: C80, C38, M0