Web-Tabanlı Semantik Bir Yöntemle Türkçe Karakter Düzeltme


ÇAKMAK F., DİRİ B.

23. IEEE Sinyal İşleme Uygulamaları Kurultayı, Malatya, Türkiye, 16 Mayıs 2015, ss.1

  • Yayın Türü: Bildiri / Tam Metin Bildiri
  • Basıldığı Şehir: Malatya
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.1
  • Yıldız Teknik Üniversitesi Adresli: Evet

Özet

Özetçe —Çeşitli kısıtlardan dolayı (klavye tuş takımı, editör kısıtlaması) Türkçe karakterler kullanılmadan yazılmı¸s bir metnin barındırdıgı karakter hatalarının düzeltilmesi el ile gerçekleştirildiginde oldukça zaman almaktadır. Aynı zamanda bir  çok durumda gözden kaçan kelimeler de olmaktadır. Özellikle kelimelerin Türkçe karaktersiz halleri (kir/kır) bir anlam ifade ediyorsa bunların gözden kaçması oldukça dogaldır. Bu gibi ^ durumlarda, kelime bazında düzeltmeler yetersiz kalmakta, ilgili kelimenin cümle içerisindeki yeri göz önünde bulundurularak anlamsal bir takım düzeltmelere gidilmesi gerekmektedir. Örnegin,  "kir dugunlerini cok severim." şeklinde yazılmış bir cümlede, kir kelimesi de anlamlı bir kelime olmasına ragmen cümlenin ^ akışı göz önünde bulunduruldugunda bu kelimenin  kır diye düzeltilmesi gerekmektedir. Bu çalışma kapsamında, verilen bir metin içerisindeki Türkçe karakterlerin düzeltilmesi için biçim bilimsel işlemler kullanmayan web tabanlı anlamsal bir algoritma tasarlanmış ve yüksek başarımda sonuçlar elde edilmi¸stir.

Anahtar Kelimeler—otomatik Türkçe karakter düzeltme, webtabanlı, doğal dil işleme, deasciifier

Abstract—Correction of Turkish characters in a text, which written without using Turkish characters, takes quite time if done manually due to various constraints (keyboard keypad, editor restriction). In addition, it can be overlooked some words in many cases. Especially if the case is also a word of Turkish characterless (kir/kır) makes sense, it is quite natural to overlook them. In such cases, on the basis of word correction is inadequate, considering related word’s place in the sentence, it is necessary to go to semantically corrections. Let’s consider the following sentence "kir dugunlerini cok severim.". Although kir is meaningful word, when the flow of sentences considered, kir must correct with kır. In this study, a semantic web based algorithm was designed and high success ratio was obtained, when correcting Turkish characters without using morphological tools.

Keywords—automatic correction of Turkish characters, webbased, natural language processing, deasciifier