Ontoloji Çizge ile Doküman Sınıflandırma


Tellioğlu A., Rahmet F., DİRİ B.

24.Sinyal İşleme ve İletişim Uygulamaları (SİU) Kurultayı, Zonguldak, Türkiye, 16 Mayıs 2016, ss.1-5

  • Basıldığı Şehir: Zonguldak
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.1-5

Özet

Özetçe—Bu çalışmada, Vikipedi sayfalarından linkler yardımı ile kavramlar toplanmış, toplanan kavramlar ile diğer kavramlar arasındaki bağlantılar çıkarılmıştır. Vikipedi sayfalarında bulunan metin içeriklerine göre kavramlar arasındaki bağlantıların güçleri bulunarak, toplanan kavramlar ve bağlantı frekansları yardımı ile ontoloji çizgesi oluşturulmuştur. Oluşturulan çizge yardımı ile kullanıcı tarafından girilen dokümanın ana konuları tespit edilmiştir. Doküman ana konularının tespit edilebilmesi için doküman içerisinde geçen kavramlar tespit edilerek her bir kavramın ontoloji çizgesi yardımı ile ana konuya olan uzaklıkları saptanmıştır. Çalışma dilden bağımsız olarak tasarlanmıştır. Girilen dokümanların büyük bir çoğunluğunda doğru ana konu tespit edilebilmiştir. Anahtar Kelimeler — Ontoloji Çizge, Doküman Sınıflandırma, Vikipedi

Abstract—In this study, subjects had been collected from Wikipedia web pages by using links. Subjects had been connected with other subjects. Context of Wikipedia pages had been used for defining power of link between subjects. Ontology graph is created with subjects and power of links. Main subjects of given documents had been calculated with the Ontology graph. For calculation, all subjects had been found in the context of document. Main subjects had been found for each subject in the documents. This study can operate for all languages with any issues. System had been calculated the true main subjects of most documents

Keywords — Ontology Graph, Document Classification, Wikipedia