Yerli Yapay Zeka Kumru Tanıtıldı. Artık Bizimde Var!

VNGRS adlı Türk teknoloji girişimi tarafından geliştirilen yerli yapay zeka modeli Kumru ile ülkemiz tarihi bir dönüm noktasına ulaştı. Tamamen Türkçe verilerle sıfırdan eğitilen ilk büyük dil modeli olan Kumru, Türkçe dil işlemede yeni bir çığır açarken, kurumsal kullanıcılar için güvenli ve erişilebilir bir yerli yapay zeka çözümü sunuyor. Bu kapsamlı makalede, Türkiye’nin yapay zekasının teknik özelliklerini, kullanım alanlarını, performansını ve Türk teknoloji ekosistemi için taşıdığı önemi detaylı şekilde inceleyeceğiz.

Kumru Nedir? Temel Özellikleri ve Teknik Altyapısı

Makalemize misafir olan yerli ve milli yapay zekamız, Türkiye’nin ilk tamamen Türkçe verilerle sıfırdan eğitilmiş büyük dil modelidir. VNGRS ekibi tarafından geliştirilen model, 7.4 milyar parametre kapasitesiyle Türkçe dil işleme görevlerinde yüksek performans sergiliyor. Yerli yapay zekanın en dikkat çekici özelliklerinden biri, sadece 16 GB VRAM’e sahip tüketici sınıfı GPU’larda (RTX A4000 veya RTX 3090 gibi) bile çalışabilmesi, böylece büyük sunucu altyapılarına ihtiyaç duyulmadan kullanılabilmesidir.

Teknik özellikler

  • Model büyüklüğü: 7,4 milyar parametre olarak duyuruldu.
  • Bağlam uzunluğu: ~8.192 Türkçe token (uzun belgeleri işleyebilme).
  • Donanım verimliliği: 16 GB VRAM’e sahip tüketici GPU’larında bile çalışabilecek şekilde optimize edildiği belirtiliyor — bu, kurum içi düşük maliyetli kullanım için önemli.
  • Çokdillilik / kodlama: Türkçe odaklı olmakla birlikte İngilizce kodlama gibi ikincil görevleri desteklediği bildirildi. Haber7

Not: Bu teknik detaylar ilk haber duyurularına dayanır; ilerleyen haftalarda sürüm güncellemeleri, API planları ve lisans ayrıntıları netleşebilir. Bu tür değişiklikler yapay zeka projelerinde sık görülür, dolayısıyla üretimde kullanmadan önce resmi dokümantasyon kontrol edilmelidir.

Nasıl Kullanılır?

Kullanımı ise çok basit :
Resmi Web Sitesi olan kumru.ai üzerinden doğrudan erişim ağlayarak internet sitesini açınız. Ardından size bir bilgilendirme mesajı gösterecektir. Ardından bilgilendirme mesajını geçerek doğrudan sohbet arayüzüne erişebilirsiniz. Ücretsiz ve şimdilik kayıt olma şartı sunulmuyor. Herhangi bir kayıt olma seçeneği de eklenmemiş. Ama şuanda beta aşamasında olduğu düşünülürse ilerde kayıt zorunluluğu yada ücretli modeller gelmesi düşünülebilir.

Eğitim Süreci ve Altyapısı

Kumru’nun geliştirilme süreci, 45 günlük yoğun bir ön eğitim aşamasını kapsıyor. Bu süreçte NVIDIA H100 ve H200 GPU’lar kullanılarak, 500 GB’lık özenle temizlenmiş ve tekilleştirilmiş Türkçe veri kümesi üzerinde eğitim gerçekleştirilmiştir. Model, 300 milyar token ile eğitildikten sonra, yaklaşık 1 milyon örnekten oluşan bir veri karışımıyla ince ayar (fine-tuning) aşamasından geçirilmiştir.

VNGRS ekibi, Türkçe diline özgü yapısal özellikleri dikkate alarak, çok dilli modellerden türetilmeyen tamamen sıfırdan geliştirilmiş bir model inşa etmiştir. Bu yaklaşım, Kumru’nun Türkçe’nin dilbilgisel yapısını, deyimsel ifadelerini ve anlam derinliğini çok dilli modellerden daha doğru bir biçimde anlayabilmesini sağlamaktadır.

Kullanım Alanları ve Uygulama Senaryoları

Kurumsal Uygulamalar

  • Belge analizi ve özetleme: 20 A4 sayfaya kadar uzun belgeleri, raporları veya sözleşmeleri bir bütün olarak anlayabilmekte ve özetleyebilmektedir
  • Soru-cevap sistemleri: Türkçe sorulara doğal ve bağlama uygun yanıtlar üretebilmektedir
  • Çağrı merkezi analitiği: Müşteri hizmetleri görüşmelerinin analizinde kullanılabilmektedir
  • RAG tabanlı bilgi yönetimi sistemleri: Kurumsal bilgi tabanları üzerinde etkili arama ve bilgi çıkarımı yapabilmektedir

Bireysel ve Akademik Kullanım

  • Metin üretimi, özetleme, yeniden yazma: Yaratıcı yazım işlerinde yüksek başarı göstermektedir
  • Akademik metin üretimi ve analizi: Araştırma ve akademik çalışmalarda destek sağlamaktadır
  • Sosyal medya içerik önerisi ve üretimi: Türkçe odaklı içerik üretimi ve medya uygulamalarında kullanılabilmektedir

Kumru’nun Stratejik Önemi ve Veri Güvenliği

Yapay zekamızın en dikkat çeken yönlerinden biri, veri güvenliği ve gizliliği açısından sağladığı avantajlardır. Yerli olarak geliştirilen ve Türkiye’de barındırılabilen bu model, kamu kurumları ve özel sektör için on-premise (yerinde) kurulum olanağı sunmaktadır. Bu da hem yasal uyumluluk hem de hassas veri koruması açısından büyük önem taşımaktadır.

Türkiye’de özellikle kamu güvenliğinin önem arz ettiği sektörlerde faaliyet gösteren pek çok kurum, veri güvenliğine dair regülasyonlar sebebiyle ChatGPT gibi hizmetleri kullanamamaktadır. Kumru, bu kurumlara güvenli ve yerli bir alternatif sunmaktadır.

Açık Kaynak Sürüm: Kumru-2B

Geliştirici şirket VNGRS, 7B modelinin yanı sıra daha küçük ve erişilebilir bir versiyonu olan 2B’yi de açık kaynak olarak yayınlamıştır. Bu model, 8.192 token’lık bağlam uzunluğuna ve 300 milyar ön eğitim token’ına sahiptir. Üstelik sadece 4.8 GB bellekle çalışabilmekte, bu da mobil cihazlarda bile dağıtım yapılabileceği anlamına gelmektedir.

2B modeli , Hugging Face platformu üzerinden geliştiricilerin erişimine açılmıştır. Bu hamle, Türk geliştiricilerin yapay zeka uygulamaları geliştirmesini kolaylaştırmayı ve yerli yapay zeka ekosisteminin büyümesini teşvik etmeyi amaçlamaktadır.

Mevcut Sınırlamalar ve Geliştirme Süreci

Yeni yapay zeka modelimiz, aktif olarak geliştirilmekte olan bir teknolojidir ve bazı sınırlamalara sahiptir. Geliştirici şirket, modelin henüz pekiştirmeli öğrenme (reinforcement learning) aşamasından geçmediğini, bu nedenle özellikle matematik işlemlerinde ve ezbere dayalı sorularda hatalar yapabildiğini belirtmektedir.

Model, yaratıcı yazım işlerinde daha başarılıyken, matematik işlemlerinde sınırlı yeteneklere sahiptir. Ayrıca kodlama konusunda da eğitim verisi sınırlı olduğu için bu alanda iddialı değildir.

Neden Önemli ?

Yerli yapay zeka sadece bir modelden ziyade, aynı zamanda Türkçenin dijital dünyada hak ettiği yeri alması için atılmış büyük bir adımdır. VNGRS, bu projeyle Türkiye’nin küresel yapay zeka ekosisteminde güçlü bir oyuncu haline gelmesini hedeflemektedir.

Düşük donanım gereksinimleri, yüksek Türkçe performansı ve yerinde kurulum imkanıyla Kumru, Türk kurumları ve geliştiricileri için değerli bir yerli yapay zeka kaynağı olmaya adaydır. Aktif geliştirme süreci devam eden bu modelin, önümüzdeki dönemde yeteneklerinin daha da gelişmesi ve yeni sürümlerle daha güçlü hale gelmesi beklenmektedir.

Yerli yapay zeka, Türkçe’nin teknolojiyle buluştuğu yeni dönemin sembolü olarak, Türkiye’nin dijital bağımsızlık hedefinde önemli bir rol oynamaya aday görünüyor.

Scroll to Top