120E100- Yapay Öğrenmede Eğitim Örneklerini Sıralama Optimizasyonu


Creative Commons License

Amasyalı M. F. (Yürütücü)

TÜBİTAK Projesi, 2020 - 2023

  • Proje Türü: TÜBİTAK Projesi
  • Başlama Tarihi: Eylül 2020
  • Bitiş Tarihi: Mart 2023

Proje Özeti

İnsan öğrenmesi artımlıdır(tüm bilgiler tek seferde verilmez) ve basit örneklerle başlar. Eğitim sistemlerimiz bu hipotez

üzerine kurulmuştur. Önce temel / basit konular kavratılır, ardından zor konulara geçilir. Makinelerin öğrenmesini

amaçlayan yapay öğrenme alanında da bu hipotez kullanılarak planlı öğrenme (curriculum learning) ve türevleri

geliştirilmiştir. Bu yöntemler literatürde eğitimi iteratif olan derin yapay sinir ağlarının eğitimine uygulanmış ve klasik olan

(örneklerin rastgele sırada verildiği) yönteme göre daha başarılı sonuçlar elde edilmiştir. Başarılı sonuçların etkisi ile

planlı öğrenme derin öğrenme mimarileri özelinde oldukça sıcak bir araştırma alanı haline gelmiştir. Bununla birlikte

literatürde örnekleri zordan kolaya göre sıralayarak yine klasik yönteme göre daha başarılı sonuçlar bulan çalışmalar da

mevcuttur. Projenin fizibilite çalışmaları sırasında bu durumu ilk elden gözlemledik. Kolaydan zora doğru sıralamanın

daha başarılı olması baştaki hipotezimizle ve sağduyumuzla uyumlu olmasına rağmen tersten sıralamanın iyiliği için bir

açıklama bilgimiz dahilinde henüz bulunamamıştır. Bu merak uyandıran duruma teorik bir açıklama getirmek projemizin

hedeflerinden biridir.

Orijinal ve yapay örnekler içeren veri kümeleri için mevcutlardan daha başarılı bir sıralama optimizasyon yöntemi

geliştirmek projemizin bir başka hedefidir.

Planlı öğrenme ve türevleri klasik yönteme göre daha fazla uzun eğitim sürelerine sahiptir. Dağıtık öğrenme yöntemlerini

geliştireceğimiz sıralama yöntemlerine uygulayarak bu ek maliyeti azaltmak da projemiz kapsamındadır.

Projenin deneysel çalışmalarında çeşitli derin öğrenme mimarileri ve eğitim algoritmaları, diğer stokastik yapay öğrenme

algoritmaları, yapay örnek üretim algoritmaları metin veri kümeleri üzerinde kullanılacaktır.

Projenin özgün yönleri literatürde bu konuda eksik kalınan noktaları doldurmak üzere, planlı öğrenme için teorik bir

açıklama geliştirmek, yeni sıralama optimizasyonu yöntemleri geliştirmek, geniş kapsamda deneysel çalışmalar

yürütmek, yapay örnekler içeren veri kümelerine planlı öğrenmeyi uygulamak, yapay sinir ağları haricindeki diğer

stokastik algoritmalara planlı öğrenmeyi uygulamak ve dağıtık öğrenme yöntemlerini planlı öğrenmeye uygulamaktır.

Projenin fizibilite çalışmalarında genel amaçlı veri kümeleri için, mevcut sıralama optimizasyonu yöntemlerinin klasik

yönteme göre, diğerlerinde başarıyı düşürmeden en fazla %33’ünde başarıyı arttırabildiğini gördük. Geliştireceğimiz

sıralama optimizasyonu yöntemleri ile metin veri kümelerinde bu oranın en az %60 olmasını hedeflemekteyiz.

Proje çıktıları bilimsel yayınlar, yetişmiş bilim insanları, yapay öğrenme araştırmacılarına açık kaynak olarak

sunacağımız yazılım kütüphaneleri olacaktır.