Türçe Doğal Dil İşleme Çalışmaları

Türkçe Doğal Dil İşleme
Türkçe Doğal Dil İşleme

Bir zamanlar yapay zeka çalışmalarının alt dalı gibi düşünülen Doğal Dil İşleme konusu günümüzde internetin gelişmesi ve insanların ortak dil arayışları neticesinde çok daha önemli olmuştur. Uzun senelerdir dünyeda Doğal Dil İşleme konusunda bir çok araştırma yapılmış, bilakis ingilizce dili konusunda oldukça ilerleme kaydetmiştir

Google Translate, Yandex ve Bing translate gibi tüm dünyaya çeviri hizmet veren servisler Doğal Dil İşleme çalışmaları sonucunda ortaya çıkan ürünlerden bazılarıdır. Yine arama motorlarını düşünürsek, milyonlarca siteyi indeksleyen arama motorları elbette ki Doğal Dil Çalışmalarının en büyük öncüleridir.

Türkiye de Türkçe adına Doğal Dil Çalışmaları yapılmaktadır. Genellikle üniversitelerin oluşturdukları çalışma grupları içerisinde yapılan bu çalışmalar bana göre çok ileri düzeyde değildir. Türkiye de Doğal Dil Çalışması sayılabilecek en geniş çalışma Zemberek isimli Açık Kaynak Kodlu çalışmadır. Üniversite çalışma gruplarının neredeyse tamamı zemberek kütüphanesini kullanmakta ancak yaptıkları çalışmaların hepsi kapalı kaynak kodlu olarak sadece beli bir kesime dağıtım yapılmaktadır. Bana göre üniversitelerin bu kıskanç tutumu Türkçe Doğal Dil İşleme çalışmalarının ilerleyişinde engel teşkil etmektedir.

Üniversitelerin bu tutumları hakkında oldukça doluyum. Üniversiteler yaptıkları çalışmaları paylaşmamakla kalmayıp aynı zamanda buldukları sonuçları da paylaşmaya pek hevesli değiller. ODTU üniversitesinin bir türkçe derlem çalışması var. Türkçee kullanılan bir milyon kelimeyi bir araya getirmeyi planlıyorlar. Ancak alalade biri bu derleme yapılan çalışmalara ulaşamamakta. Ulaşmak isterseniz de ancak imzalı form doldurup fax çekmeniz gerekiyor. Ancak gönderecekleri garanti değil. Onu geçtim böyle bilim nasıl ilerler. Hemde sitelerinde bize katılın yardım edin yazmışlar. Koskoca üniversite yaptığı çalışmayı paylaşmıyor ve daha da yardım istiyor. Sonra da Doğal Dil Çalışması yapacaz.

Amacım bu yazıda dert yanmak değildi ancak çok dertliyim bu konuda. Gönlüm isterdi ki üniversitelerin bu tutumları olmasa da yaptıklarını paylaşmayı bilselerdi de bunda buraya gögsümü gere gere yazsaydım üniversitelerin çalışmalarını. O kadar gizli yürütüyorlar ki yaptıkları nın sadece isimlerini öğrenebiliyorsunuz. Proje ne aşamada bitmiş bitmemiş planları neler biz katkıda bulunabilirmiyiz gibi sorular hep havada kalıyor maalesef. Bu yazımız çok uzadı farkındayım bir daha ki yazımızda da Türkiye Yapılan Doğal Dil Çalışmalarının İnternet sayfası derlemini oluşturacağım.

Takipte kalın, esen kalın.

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir