Doğal Dil İşleme ve Duygu Analizi
Herkese merhabalar! Beni yapay zeka alanına çeken ve yüksek lisans, doktora tezlerimi yazmak istediğim alan olan Doğal Dil İşleme ve Duygu Analizi konusunda bildiklerimi size aktarmaya çalışacağım.
Doğal Dil İşleme, Yapay Zeka çalışmaları yaygınlaşmadan önce de var olan bir konuydu. Bizim bu tarz yapılarak ihtiyaç duymamızın sebebi, diğer konularla aynı aslında; “İşlenecek veri çok fazla ve her yerde.”. Artık bir insanın el yordamıyla hallede bileceğinden kat ve kat fazla “ortalıkta” dolaşmakta.

Doğal Dil İşleme araştırmacıları, insanların dili nasıl anladığı ve kullandıkları hakkında bilgi toplamayı amaçlamaktadır, böylece bilgisayar sistemlerinin istenen görevleri yerine getirmek için doğal dilleri anlamasını ve manipüle etmesini sağlamak için uygun araçlar ve teknikler geliştirilebilir.
Herhangi bir Doğal Dil İşleme probleminin merkezinde “doğal dil anlayışı” gibi önemli bir sorunu vardır.
Doğal dili anlayan bilgisayar programları oluşturma süreci üç ana problem içerir:
1- Düşünce süreci,
2- Dilsel girdinin temsili ve anlamı,
3- Dünya bilgisi,
ile ilgilidir.
Çünkü dil, sadece harflerin bir araya gelmesiyle oluşmamaktadır. Bir kelimenin anlamını belirleyen, birçok faktör vardır. Kelimenin sözlük anlamı ile insanlarda bulunan karşılığı aynı olamamakta.
Böylece, bir NLP sistemi, kelimenin morfolojik yapısını, doğasını (konuşma kısmı, anlamı gibi) vb. belirlemek için kelime düzeyinde başlayabilir ve daha sonra kelime sırasını, dil bilgisini, tüm cümlenin anlamı ve daha sonra bağlam ve genel çevresine kadar ulaşılır. Belirli bir kelime veya cümlenin belirli bir bağlam veya alanda belirli bir anlamı veya çağrışımı olabilir ve belirli bağlamdaki diğer birçok kelime ve / veya cümle ile ilişkili olabilir.
Gördüğünüz gibi, daha ilk adımda işler karışmaya başladı. Aslında, makine öğrenmesi işine biraz bile aşinaysanız bu sizi şaşırtmamalı. Çünkü amacımız, karışık işlerin içinden çıkmak…
Liddy (1998) ve Feldman (1999), doğal dilleri anlamak için, insanların metin veya konuşma dillerinden anlam çıkarmak için kullandıkları aşağıdaki yedi birbirine bağlı seviyeyi ayırt edebilmenin önemli olduğunu ileri sürmektedir:
• Telaffuzla ilgili fonetik veya fonoloji seviye
• Kelimelerin en küçük kısımlarıyla ilgilenen, bir anlam taşıyan, ek ve ön ekleri içeren morfolojik seviye
• Kelimelerin sözcüksel anlamları ve konuşma analizlerinin bölümleri ile ilgili sözcük seviyesi
• Dil bilgisi ve cümle yapısı ile ilgili söz dizimsel düzey
• Kelimelerin ve cümlelerin anlamları ile ilgilenen anlamsal seviye
• Belge yapılarını kullanarak farklı metin türlerinin yapısını ele alan söylem düzeyi ve
• Dış dünyadan, yani belgenin içeriği dışından gelen bilgilerle ilgilenen pragmatik düzey.
Doğal bir dil işleme sistemi bu analiz seviyelerinin tümünü veya bir kısmını içerebilir.

Duygu Analizi
Duygu Analizi de DDİ konularının yaygınlaşmasından sonra karşımıza çıkmış bir diğer olgu. Beklentimiz, makinelerin, metinlerdeki duyguyu anlayabilmesi ve bize bir çıktı döndürebilmesi. Ancak bunla ilgili en büyük problemlerimizden birisi, makinelerin metinleri, en nihayetinden 0 veya 1 olarak görmesi. Ne olursa olsun, makine bunları sadece 0 veya 1 olarak görecek ve bunun daha ötesi henüz yok.
http://sentiwordnet.isti.cnr.it/ adresinden ulaşabileceğiniz, yaklaşık 180 bin satırlık İngilizce bir duygu analizi sözlüğü bulunmakta. Burada, kelimeler -8 ile +8 arasında bir değerlendirilmeye alınmış. +8 oldukça olumlu (pozitif) anlamı taşırken -8 oldukça olumsuz (negatif) anlamı taşımakta.
Bir cümleyi içerdiği kelimelere göre puanlayıp, bu puanların ortalamasına göre cümlenin genel olarak negatif anlam mı yoksa pozitif anlam mı taşıdığını ortaya koymaya çalışmakta.
Örneğin,

Amazondan bir kullanıcı yorumu. Wonderboard isimli Chrome eklentisi sayesinde, istediğiniz İnternet sitesindeki yazıları bu şekilde görebilirsiniz.
Peki, Türkçe için problem ne? İngilizce için olumlu olumsuz anlamı katan kelimeler, bir diğer kelimenin yanına veya başına/sonuna eklenir.
Örneğin;

Fakat Türkçe’de bu iş bu kadar kolay yürümemekte. Bu tarz çalışmaları incelerken çok güzel bir örneğe denk gelmiştim size de aktarmak isterim.
Lütfen, aşağıdaki cümlelerin sırayla, olumlu mu yoksa olumsuz mu olduğuna bakın.

Son yorumu, Whatsapp’ın yeni karanlık modu geldiğinde görmüştüm.
Cümlenin orijinal hali “Yeni karanlık mod çok mu güzel olmuşşşş” idi. Siz baktığınızda, bunun aslında olumlu bir anlam taşıdığını ve kullanıcının bu yeni güncellemeyi beğendiği çıkarımını yapabilirsiniz.
Ayrıca, bir diğer problem, Türkçe’de olumsuz yapan eklerin cümle ortasına gelebilmesi.
Örneğin;

Bu tarz kelimeler Türkçe çalışmanın önündeki akla gelen ilk engellerden.
Sonuç
Bu yazıyı yazma amacım, aslında kendime bazı hedefler çizmek. Hayalim ve hedefim Türkçe Duygu Analizi alanında kendimi geliştirmek ve bu süreçte yaşadıklarımı da sizinle paylaşmak. Yapmak istediğim, Doğal Dil İşleme alanında kendime bir yol haritası çıkardıktan sonra sizlere anlatarak bu sürece benden sonra katılmak isteyenlere de bir rehber olması.
