Amasyalı M. F. (Yürütücü)
TÜBİTAK Projesi, 2020 - 2023
İnsan öğrenmesi artımlıdır(tüm bilgiler tek seferde verilmez) ve basit örneklerle başlar. Eğitim sistemlerimiz bu hipotez
üzerine kurulmuştur. Önce temel / basit konular kavratılır, ardından zor konulara geçilir. Makinelerin öğrenmesini
amaçlayan yapay öğrenme alanında da bu hipotez kullanılarak planlı öğrenme (curriculum learning) ve türevleri
geliştirilmiştir. Bu yöntemler literatürde eğitimi iteratif olan derin yapay sinir ağlarının eğitimine uygulanmış ve klasik olan
(örneklerin rastgele sırada verildiği) yönteme göre daha başarılı sonuçlar elde edilmiştir. Başarılı sonuçların etkisi ile
planlı öğrenme derin öğrenme mimarileri özelinde oldukça sıcak bir araştırma alanı haline gelmiştir. Bununla birlikte
literatürde örnekleri zordan kolaya göre sıralayarak yine klasik yönteme göre daha başarılı sonuçlar bulan çalışmalar da
mevcuttur. Projenin fizibilite çalışmaları sırasında bu durumu ilk elden gözlemledik. Kolaydan zora doğru sıralamanın
daha başarılı olması baştaki hipotezimizle ve sağduyumuzla uyumlu olmasına rağmen tersten sıralamanın iyiliği için bir
açıklama bilgimiz dahilinde henüz bulunamamıştır. Bu merak uyandıran duruma teorik bir açıklama getirmek projemizin
hedeflerinden biridir.
Orijinal ve yapay örnekler içeren veri kümeleri için mevcutlardan daha başarılı bir sıralama optimizasyon yöntemi
geliştirmek projemizin bir başka hedefidir.
Planlı öğrenme ve türevleri klasik yönteme göre daha fazla uzun eğitim sürelerine sahiptir. Dağıtık öğrenme yöntemlerini
geliştireceğimiz sıralama yöntemlerine uygulayarak bu ek maliyeti azaltmak da projemiz kapsamındadır.
Projenin deneysel çalışmalarında çeşitli derin öğrenme mimarileri ve eğitim algoritmaları, diğer stokastik yapay öğrenme
algoritmaları, yapay örnek üretim algoritmaları metin veri kümeleri üzerinde kullanılacaktır.
Projenin özgün yönleri literatürde bu konuda eksik kalınan noktaları doldurmak üzere, planlı öğrenme için teorik bir
açıklama geliştirmek, yeni sıralama optimizasyonu yöntemleri geliştirmek, geniş kapsamda deneysel çalışmalar
yürütmek, yapay örnekler içeren veri kümelerine planlı öğrenmeyi uygulamak, yapay sinir ağları haricindeki diğer
stokastik algoritmalara planlı öğrenmeyi uygulamak ve dağıtık öğrenme yöntemlerini planlı öğrenmeye uygulamaktır.
Projenin fizibilite çalışmalarında genel amaçlı veri kümeleri için, mevcut sıralama optimizasyonu yöntemlerinin klasik
yönteme göre, diğerlerinde başarıyı düşürmeden en fazla %33’ünde başarıyı arttırabildiğini gördük. Geliştireceğimiz
sıralama optimizasyonu yöntemleri ile metin veri kümelerinde bu oranın en az %60 olmasını hedeflemekteyiz.
Proje çıktıları bilimsel yayınlar, yetişmiş bilim insanları, yapay öğrenme araştırmacılarına açık kaynak olarak
sunacağımız yazılım kütüphaneleri olacaktır.