VNGRS adlı Türk teknoloji girişimi tarafından geliştirilen yerli yapay zeka modeli Kumru ile ülkemiz tarihi bir dönüm noktasına ulaştı. Tamamen Türkçe verilerle sıfırdan eğitilen ilk büyük dil modeli olan Kumru, Türkçe dil işlemede yeni bir çığır açarken, kurumsal kullanıcılar için güvenli ve erişilebilir bir yerli yapay zeka çözümü sunuyor. Bu kapsamlı makalede, Türkiye’nin yapay zekasının teknik özelliklerini, kullanım alanlarını, performansını ve Türk teknoloji ekosistemi için taşıdığı önemi detaylı şekilde inceleyeceğiz.
İçindekiler
Kumru Nedir? Temel Özellikleri ve Teknik Altyapısı
Makalemize misafir olan yerli ve milli yapay zekamız, Türkiye’nin ilk tamamen Türkçe verilerle sıfırdan eğitilmiş büyük dil modelidir. VNGRS ekibi tarafından geliştirilen model, 7.4 milyar parametre kapasitesiyle Türkçe dil işleme görevlerinde yüksek performans sergiliyor. Yerli yapay zekanın en dikkat çekici özelliklerinden biri, sadece 16 GB VRAM’e sahip tüketici sınıfı GPU’larda (RTX A4000 veya RTX 3090 gibi) bile çalışabilmesi, böylece büyük sunucu altyapılarına ihtiyaç duyulmadan kullanılabilmesidir.
Web sitesi arayüzü bu şekilde gözüküyor.
Teknik özellikler
Model büyüklüğü: 7,4 milyar parametre olarak duyuruldu.
Bağlam uzunluğu: ~8.192 Türkçe token (uzun belgeleri işleyebilme).
Donanım verimliliği: 16 GB VRAM’e sahip tüketici GPU’larında bile çalışabilecek şekilde optimize edildiği belirtiliyor — bu, kurum içi düşük maliyetli kullanım için önemli.
Çokdillilik / kodlama: Türkçe odaklı olmakla birlikte İngilizce kodlama gibi ikincil görevleri desteklediği bildirildi. Haber7
Not: Bu teknik detaylar ilk haber duyurularına dayanır; ilerleyen haftalarda sürüm güncellemeleri, API planları ve lisans ayrıntıları netleşebilir. Bu tür değişiklikler yapay zeka projelerinde sık görülür, dolayısıyla üretimde kullanmadan önce resmi dokümantasyon kontrol edilmelidir.
Nasıl Kullanılır?
Kullanımı ise çok basit : Resmi Web Sitesi olan kumru.ai üzerinden doğrudan erişim ağlayarak internet sitesini açınız. Ardından size bir bilgilendirme mesajı gösterecektir. Ardından bilgilendirme mesajını geçerek doğrudan sohbet arayüzüne erişebilirsiniz. Ücretsiz ve şimdilik kayıt olma şartı sunulmuyor. Herhangi bir kayıt olma seçeneği de eklenmemiş. Ama şuanda beta aşamasında olduğu düşünülürse ilerde kayıt zorunluluğu yada ücretli modeller gelmesi düşünülebilir.
Eğitim Süreci ve Altyapısı
Kumru’nun geliştirilme süreci, 45 günlük yoğun bir ön eğitim aşamasını kapsıyor. Bu süreçte NVIDIA H100 ve H200 GPU’lar kullanılarak, 500 GB’lık özenle temizlenmiş ve tekilleştirilmiş Türkçe veri kümesi üzerinde eğitim gerçekleştirilmiştir. Model, 300 milyar token ile eğitildikten sonra, yaklaşık 1 milyon örnekten oluşan bir veri karışımıyla ince ayar (fine-tuning) aşamasından geçirilmiştir.
VNGRS ekibi, Türkçe diline özgü yapısal özellikleri dikkate alarak, çok dilli modellerden türetilmeyen tamamen sıfırdan geliştirilmiş bir model inşa etmiştir. Bu yaklaşım, Kumru’nun Türkçe’nin dilbilgisel yapısını, deyimsel ifadelerini ve anlam derinliğini çok dilli modellerden daha doğru bir biçimde anlayabilmesini sağlamaktadır.
Kullanım Alanları ve Uygulama Senaryoları
Kurumsal Uygulamalar
Belge analizi ve özetleme: 20 A4 sayfaya kadar uzun belgeleri, raporları veya sözleşmeleri bir bütün olarak anlayabilmekte ve özetleyebilmektedir
Soru-cevap sistemleri: Türkçe sorulara doğal ve bağlama uygun yanıtlar üretebilmektedir
Çağrı merkezi analitiği: Müşteri hizmetleri görüşmelerinin analizinde kullanılabilmektedir
RAG tabanlı bilgi yönetimi sistemleri: Kurumsal bilgi tabanları üzerinde etkili arama ve bilgi çıkarımı yapabilmektedir
Bireysel ve Akademik Kullanım
Metin üretimi, özetleme, yeniden yazma: Yaratıcı yazım işlerinde yüksek başarı göstermektedir
Akademik metin üretimi ve analizi: Araştırma ve akademik çalışmalarda destek sağlamaktadır
Sosyal medya içerik önerisi ve üretimi: Türkçe odaklı içerik üretimi ve medya uygulamalarında kullanılabilmektedir
Kumru’nun Stratejik Önemi ve Veri Güvenliği
Yapay zekamızın en dikkat çeken yönlerinden biri, veri güvenliği ve gizliliği açısından sağladığı avantajlardır. Yerli olarak geliştirilen ve Türkiye’de barındırılabilen bu model, kamu kurumları ve özel sektör için on-premise (yerinde) kurulum olanağı sunmaktadır. Bu da hem yasal uyumluluk hem de hassas veri koruması açısından büyük önem taşımaktadır.
Türkiye’de özellikle kamu güvenliğinin önem arz ettiği sektörlerde faaliyet gösteren pek çok kurum, veri güvenliğine dair regülasyonlar sebebiyle ChatGPT gibi hizmetleri kullanamamaktadır. Kumru, bu kurumlara güvenli ve yerli bir alternatif sunmaktadır.
Açık Kaynak Sürüm: Kumru-2B
Geliştirici şirket VNGRS, 7B modelinin yanı sıra daha küçük ve erişilebilir bir versiyonu olan 2B’yi de açık kaynak olarak yayınlamıştır. Bu model, 8.192 token’lık bağlam uzunluğuna ve 300 milyar ön eğitim token’ına sahiptir. Üstelik sadece 4.8 GB bellekle çalışabilmekte, bu da mobil cihazlarda bile dağıtım yapılabileceği anlamına gelmektedir.
2B modeli , Hugging Face platformu üzerinden geliştiricilerin erişimine açılmıştır. Bu hamle, Türk geliştiricilerin yapay zeka uygulamaları geliştirmesini kolaylaştırmayı ve yerli yapay zeka ekosisteminin büyümesini teşvik etmeyi amaçlamaktadır.
Mevcut Sınırlamalar ve Geliştirme Süreci
Yeni yapay zeka modelimiz, aktif olarak geliştirilmekte olan bir teknolojidir ve bazı sınırlamalara sahiptir. Geliştirici şirket, modelin henüz pekiştirmeli öğrenme (reinforcement learning) aşamasından geçmediğini, bu nedenle özellikle matematik işlemlerinde ve ezbere dayalı sorularda hatalar yapabildiğini belirtmektedir.
Kumru adlı yapay zekanın ana sayfasında çıkan bilgilendirme mesajı
Model, yaratıcı yazım işlerinde daha başarılıyken, matematik işlemlerinde sınırlı yeteneklere sahiptir. Ayrıca kodlama konusunda da eğitim verisi sınırlı olduğu için bu alanda iddialı değildir.
Neden Önemli ?
Yerli yapay zeka sadece bir modelden ziyade, aynı zamanda Türkçenin dijital dünyada hak ettiği yeri alması için atılmış büyük bir adımdır. VNGRS, bu projeyle Türkiye’nin küresel yapay zeka ekosisteminde güçlü bir oyuncu haline gelmesini hedeflemektedir.
Düşük donanım gereksinimleri, yüksek Türkçe performansı ve yerinde kurulum imkanıyla Kumru, Türk kurumları ve geliştiricileri için değerli bir yerli yapay zeka kaynağı olmaya adaydır. Aktif geliştirme süreci devam eden bu modelin, önümüzdeki dönemde yeteneklerinin daha da gelişmesi ve yeni sürümlerle daha güçlü hale gelmesi beklenmektedir.
Yerli yapay zeka, Türkçe’nin teknolojiyle buluştuğu yeni dönemin sembolü olarak, Türkiye’nin dijital bağımsızlık hedefinde önemli bir rol oynamaya aday görünüyor.