Türk teknoloji şirketi CTD Systems, bir ilke imza atarak, Türkçe konuşmaları bilgisayarda yazıya dönüştüren “dikte” yazılımını geliştirdi.
Klavyeyi ortadan kaldıracak yeni teknoloji, kullanıcının sesini bir kez bilgisayara tanıtmasının ardından devreye giriyor ve sesle bilgisayara komut da verilebiliyor.
CTD System A.Ş Ar-Ge Müdürü Çetin Çetintürk, AA muhabirine yaptığı açıklamada, Türk araştırmacıları ve girişimcilerinden oluşan şirketlerinin, konuşma tanıma sistemleri üzerine 8 yıldır yürüttüğü çalışmalar sonucu “dikte” isimli yazılımı geliştirmeyi başardığını bildirdi. Çetintürk, “dikte”nin bugüne kadar “dünyada yapılmış ilk ve tek Türkçe konuşma-tanıma sistemi” olduğunu belirtti.
Dikte’nin, aynı zamanda “en yüksek kapasiteli” konuşma tanıma sistemi de olduğunu söyleyen Çetintürk, “Bundan sonra Türkçe yazıları, konuşarak bilgisayara yazma imkanına sahip olunacak” dedi.
Türkçe’nin sondan eklemeli bir dil olduğundan kelime çeşitliliğinin çok olduğunu vurgulayan Çetintürk, “Bu nedenle bugüne kadar kimse bu konunun yanına bile yanaşamadı. Geliştirdiğimiz Türkçe konuşma tanıma sistemi, aynı zamanda dünyanın en yüksek kapasiteli, en hızlı sistemi. Algoritmalar, bugünün en modern işlemcilerini sonuna kadar kullanıyor. Hatta 4 çekirdekli işlemciler şu an yetmiyor, 16 çekirdekli istiyoruz. Çünkü insanın algılaması ve tanımasıyla yarışıyoruz” ifadesini dile getirdi.
Çetintürk, söz konusu teknolojinin kullanımı ile ilgili şöyle konuştu: “Dikte kullanılırken, kullanıcının mikrofon takması ya da masasında mikrofon bulundurması gerekiyor. Konuşurken mümkün olduğunca düzgün telaffuz etmesi, cümleleri doğru seslendirmesi gerekiyor. Kullanıcının sesini ilk başta bilgisayara tanıtması işlemi 3-4 saat sürüyor. Bu esnada ekranda görülen yazılar uygun bir şekilde telaffuz ediliyor. Hem kullanıcının sesini bilgisayar öğreniyor, hem de kullanıcı sistemi ne şekilde kullanması gerektiğini öğreniyor.
Böylece kullanıcının konuşarak yazı yazması, hatta bunun ötesinde konuşarak elektronik posta yollama gibi klavye ya da mouse kullanarak yapılabilecek komutları da sesle yapması mümkün oluyor.
Diğer kullanımında ise dikte ile chat programlarında da sesi yazıya dönüştürerek karşı tarafa iletebiliyor. Yazılım paketinde outlook entegrasyonu opsiyonel olarak sunuluyor. Birtakım komutları sesle verebiliyorsunuz.”
Çetintürk, geliştirdikleri sistemin bir kelime kökünden 16 milyon kelime türetebildiğini, 25 bin kökü tanıyabildiğini, teorik kelime kapasitesinin de 300 milyar dolayında olduğunu kaydetti.
İngilizce ve Rusça dillerinde konuşma tanıma sistemlerinin 2000’lerden itibaren bulunduğunu anlatan Çetintürk, “Sistemimize en yakın teknoloji ile farkımız 10 bin kelime, 100 bin kelime değil. Sistemi, birkaç milyon kat daha fazla bir kapasiteye sahip olarak geliştirdik. Önümüzdeki yıldan itibaren biz bu işi bütün dünyaya öğretir hale, teknolojiyi tüm dünyaya biz satar hale geleceğiz, çok iddialıyız” diye konuştu.
Türkçe versiyonun ardından İngilizce versiyonu ile de pazara çıkacaklarını, bu dil için 300 milyar kelime kapasitesinden 100 bin kelime kapasitesine geri döneceklerini ifade eden Çetintürk, şöyle konuştu:
“Böylece bizim yurt dışındaki dev rakiplerimizden çok daha iyisini yapmış olacağız. Bizim elimizdeki teknoloji hepsinden daha iyi. Teknolojiyi geliştirebilmek için bilinen konuşma tanıma teorisinin ötesinde yapay zeka ve sinyal işleme algoritmalarının üzerine kurulu algoritma ve modeller geliştiriyoruz. Yakın gelecekte eşya ve otomobil gibi yaşamdaki pek çok alanla konuşarak iletişim kurulmasını sağlayan teknolojiler de geliştirilecek. 3-4 yıllık süreçte bu konuşma iletişimlerinin yaygınlaştığını hep birlikte göreceğiz.”
Genel versiyonun gelecek hafta teknomarketlerde yerini almasının ardından ortopedik ve görme engelliler için de ek paketlerin çıkacağını, bu teknolojinin, özürlülerin pek çok işini kolaylaştıracağını belirten Çetintürk, “Türkiye’de çok ciddi bir görme engelli grup var. Bu insanlar da artık kendilerine gelen yazıları okuyabilecekler ve cevaplayabilecekler. Ortopedik engellilerin klavye kullanamayanların da bilgisayar kullanması için önemli bir imkan doğmuş oldu” diye konuştu.
Çetintürk, söz konusu yazılımın hedef kitlesi ile ilgili şu bilgileri verdi: “Ülkemizde kitap ya da tez yazmak isteyen çok kıymetli bilim adamları ve sanatçılar var. Ancak bunun için vakitleri yok. Böyle bir teknoloji onların yazım süreçlerini çok kolaylaştıracağı için aslında biz bu işin bilim ve teknoloji ile sanatın gelişimine de katkıda bulunacağını düşünüyoruz.”
Algoritmaları çalıştırmak için İntel ile iş birliğine gittiklerini bildiren Çetintürk, “Dikte”nin, İntel’in işlemci teknolojisinde iyi sonuçlar verdiğini belirterek, “En kısa zamanda en doğru sonucu verebilmek için en hızlı işlemciyi kullanmamız gerekiyor. İntel ile bu yönde bir ilişkimiz var” dedi.
Çetintürk, bir süre sonra konferanslarda, toplantılarda yapılan konuşmaları da tanıyabilen sistemleri pazara sunacaklarını bildirdi.
İşlemci teknolojilerinin önde gelen firmalarından İntel’in desteğiyle oluşturulan “Dikte” ile ilgili açıklama yapan İntel Teknik Çözümler Müdürü Uygar Doyuran da teknolojinin, CTD’nin ürünü olduğunu vurgulayarak, İntel’in, geliştirilen yazılımın performansının optimize edilmesi konusunda CTD ile ortak çalıştığını anlattı.
“Dikte”nin, İntel’in çok çekirdekli işlemcileri üzerinde yüksek performansla çalıştığını belirten Doyuran, “Bundan önce Türkçe konuşmaları tanıyan bir sistem yoktu ve şu an dünyadaki en hızlı teknolojiye sahip bir sistem bu. Bugün bu ürüne rahatlıkla sahip olabiliyorsunuz. Daha önce klavye ve mouse kullanarak yapılan pek çok komutu artık konuşarak yapabileceğiz. Bazı komutları da konuşarak vereceğiz” dedi.
Doyuran, İntel’in, ABD’de 150 ülkenin yeni teknoloji geliştiricilerinin katıldığı yarışmasında “Dikte”nin yarıştığını ve ürünün birinci seçildiğini sözlerine ekledi.
Bilgi için teşekkürler.
Bilgi İçin Teşekkürler