Türkçe Parça-Bütün İlişkisi İkililerinin Derlemden Çıkartılması için Hibrit Bir Metot


ŞAHİN G. , DİRİ B. , Yıldız T.

24.Sinyal İşleme ve İletişim Uygulamaları (SİU) Kurultayı, Zonguldak, Türkiye, 16 Mayıs 2016, ss.1-5

  • Basıldığı Şehir: Zonguldak
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayısı: ss.1-5

Özet

Özetçe— Çeşitli anlamsal ilişkilere ait kavramsal ikililerin farklı kaynaklardan (sözlük tanımları, derlem vb.) otomatik ve yüksek doğrulukla çıkartılması doğal dil işlemedeki (DDİ) önemli çalışmalardan birisidir. Bu çalışmada Türkçe parça-bütün ilişkisi ikililerinin derlemden çıkartılması için hibrit bir yöntem önerilmiştir. Önerilen yöntemde derlem istatistik bilgileri, WordNet benzerlik fonksiyonları ve Word2Vec kelime vektör benzerliklerinden yararlanılmıştır. Başlangıç parça-bütün ikilileri oluşturulmuş ve ilişkiye ait şablonlar derlemden çıkartılmıştır. Şablonların güvenilirlik puanları hesaplanmış ve güvenilir şablonlar yeni ikililer üretmede kullanılmıştır. Üretilen yeni parça-bütün ikilileri için çeşitli güvenilirlik puanları hesaplanmıştır. Yöntemin başarısı 19 bütün kavram için üretilen parça kavramların doğrulukları hesaplanarak ölçülmüş ve ortalama %83 (ilk 10 ikili), %74 (ilk 20 ikili), %68 (ilk 30 ikili) tutturma değerleri elde edilmiştir.

Anahtar Kelimeler — parça-bütün anlamsal ilişkisi; şablon tabanlı yöntem; sözdizimsel şablon; anlamsal sözlük; doğal dil işleme