Archive: DDI

En Çok Kullanılan Kelimeleri Bulma

Visual C# ile bir metinde bulunan kelimelerin kullanım sıklığını bulan basit bir programın yapımını anlatacağım. Bu projeyi Doğal Dil işleme konusunda sıklıkla duyacağınız kelime derlem çalışmalarının başlangıç aşaması olarak görebilirsiniz. Yine bu projeyi temel alarak kendi kelime derlem çalışmanızı gerçekleştirebilirsiniz.11

Read more

Türkçe Doğal Dil İşleme Çalışmaları Derlemi Üniversiteler

Daha önceki yazımda Türkiye’deki tüm Doğal Dil İşleme Çalışmaları yapan ve Doğal Dil İşleme konularında Türkçe kaynak oluşturabilecek kaynakları toplama amacındaydım. Ancak araştırma yaparken üniversitelerde yapılan çalışmaların ne kadar kapalı yürütüldüğü ve bu sebeple Türkiye’deki çalışmaların ilerlemediği ve ilerlemeyeceği tespitim üzerine eleştirisel bir yazı yazmıştım.
Bu yazımda ise iyi veya kötü Doğal Dil İşleme konusunda faydalı olabileceğini düşündüğüm internet üzerindeki tüm kaynakları tek bir yerde toplamaya çalışacağım. Bu yazımızda Üniversitelerimizden çalışma grupları web sitelerine bakalım. Read more

Arama Terimleri:

  • türkçe doğal dil işleme

Türçe Doğal Dil İşleme Çalışmaları

Türkçe Doğal Dil İşleme

Türkçe Doğal Dil İşleme

Bir zamanlar yapay zeka çalışmalarının alt dalı gibi düşünülen Doğal Dil İşleme konusu günümüzde internetin gelişmesi ve insanların ortak dil arayışları neticesinde çok daha önemli olmuştur. Uzun senelerdir dünyeda Doğal Dil İşleme konusunda bir çok araştırma yapılmış, bilakis ingilizce dili konusunda oldukça ilerleme kaydetmiştir

Google Translate, Yandex ve Bing translate gibi tüm dünyaya çeviri hizmet veren servisler Doğal Dil İşleme çalışmaları sonucunda ortaya çıkan ürünlerden bazılarıdır. Yine arama motorlarını düşünürsek, milyonlarca siteyi indeksleyen arama motorları elbette ki Doğal Dil Çalışmalarının en büyük öncüleridir.

Türkiye de Türkçe adına Doğal Dil Çalışmaları yapılmaktadır. Genellikle üniversitelerin oluşturdukları çalışma grupları içerisinde yapılan bu çalışmalar bana göre çok ileri düzeyde değildir. Türkiye de Doğal Dil Çalışması sayılabilecek en geniş çalışma Zemberek isimli Açık Kaynak Kodlu çalışmadır. Üniversite çalışma gruplarının neredeyse tamamı zemberek kütüphanesini kullanmakta ancak yaptıkları çalışmaların hepsi kapalı kaynak kodlu olarak sadece beli bir kesime dağıtım yapılmaktadır. Bana göre üniversitelerin bu kıskanç tutumu Türkçe Doğal Dil İşleme çalışmalarının ilerleyişinde engel teşkil etmektedir.

Üniversitelerin bu tutumları hakkında oldukça doluyum. Üniversiteler yaptıkları çalışmaları paylaşmamakla kalmayıp aynı zamanda buldukları sonuçları da paylaşmaya pek hevesli değiller. ODTU üniversitesinin bir türkçe derlem çalışması var. Türkçee kullanılan bir milyon kelimeyi bir araya getirmeyi planlıyorlar. Ancak alalade biri bu derleme yapılan çalışmalara ulaşamamakta. Ulaşmak isterseniz de ancak imzalı form doldurup fax çekmeniz gerekiyor. Ancak gönderecekleri garanti değil. Onu geçtim böyle bilim nasıl ilerler. Hemde sitelerinde bize katılın yardım edin yazmışlar. Koskoca üniversite yaptığı çalışmayı paylaşmıyor ve daha da yardım istiyor. Sonra da Doğal Dil Çalışması yapacaz.

Amacım bu yazıda dert yanmak değildi ancak çok dertliyim bu konuda. Gönlüm isterdi ki üniversitelerin bu tutumları olmasa da yaptıklarını paylaşmayı bilselerdi de bunda buraya gögsümü gere gere yazsaydım üniversitelerin çalışmalarını. O kadar gizli yürütüyorlar ki yaptıkları nın sadece isimlerini öğrenebiliyorsunuz. Proje ne aşamada bitmiş bitmemiş planları neler biz katkıda bulunabilirmiyiz gibi sorular hep havada kalıyor maalesef. Bu yazımız çok uzadı farkındayım bir daha ki yazımızda da Türkiye Yapılan Doğal Dil Çalışmalarının İnternet sayfası derlemini oluşturacağım.

Takipte kalın, esen kalın.

Back to Top