Yerli yapay zeka Cosmos T1, kendisinden ç kat byk modellerle yarışıyor
Ƶ Cosmos ekibi tarafından geliştirilen ve Trkçe dşnen yapay zeka Cosmos T1, kendisinden 3 kat byk Google'ın yapay zeka modeline meydan okuyor. META'nın yapay zekasını da performans testinde geçen yerli Cosmos T1, bilgisayarlara yklenerek özgrce kullanılabiliyor ve gvenlik riskini ortadan kaldırıyor.
Ƶ Bilgisayar Mhendisliği ile Yapay Zeka ve Veri Mhendisliği Bölm retim yesi Prof. Dr. Mehmet Fatih Amasyalı önclğnde akademisyenlerden oluşan Cosmos ekibi, Trkçe dşnen yapay zeka Cosmos T1'i geliştirdi.
Model, matematiksel akıl yrtme performansını ölçen Trkçe GSM8K veri setinde yzde 77,41 doğruluk oranına ulaştı. Cosmos T1, zincirleme akıl yrtme (chain-of-thought reasoning) yaklaşımıyla Trkçe matematik problemlerini çözebiliyor.
Turkish-Gemma-9b-T1 modeli, Trkçe GSM8K testinde yzde 77,41 doğruluk oranına ulaştı. Aynı testte Gemma-2-9B modeli yzde 63,10 ve Llama-3.1-70B modeli yzde 66,13 performans gösterdi. 9 milyar parametreli model, 70 milyar parametreli Llama-3.1-70B modelinin zerinde performans gösterdi. Parametre sayısı açısından kendisinden yaklaşık 8 kat byk modellerle rekabet edebilecek seviyeye ulaştı.
9 milyar parametreli Turkish-Gemma-9b-T1 modeli, Trkçe matematiksel akıl yrtme testlerinde 70 milyar parametreli modellere yakın veya zerinde performans sergileyerek parametre verimliliği açısından dikkat çekti. Model, Hugging Face platformu zerinden açık ağırlıklı olarak erişime açıldı.
"Kendi bilgisayarlarına kurup özgrce kullanabiliyorlar"
Çalışmanın yrtcs Prof. Dr. Mehmet Fatih Amasyalı, “Ekip olarak ChatGPT ve benzeri yapay zeka modelleri geliştiriyoruz. Cosmos T1 bizim en son çıkan modellerimizden biri. T1 diğerlerinden farklı bir dşnce srecine sahip ve bu dşnce srecini Trkçe olarak yansıtıyor. Btn arka planda yanıtın nasıl retildiğini ara yzden adım adım görebiliyoruz. Aslında bizim model ile ChatGPT farklı kulvardalar. Gnmzde, sağlık ve savunma sanayi gibi birçok sektör verilerini bu tarz firmalarla paylaşamıyor, paylaşmak istemiyor, paylaşmaması da çok doğal. Bunun yerine on-premise'de çözm retmeleri yani kendi makinelerinin çalışması gerekiyor. T1'in ve bizim diğer rettiğimiz modellerin hepsi aslında açık ağırlıklı olarak yayınlanıyorlar ve insanlar da bu modelleri kendi bilgisayarlarına kurup kendi şirketlerinde özgrce ve rahatça kullanabiliyor” dedi.
“Firmalar kendi sreçlerine dahil ederek gvenliği artırıyor”
T1 Modelin 9 milyar parametresi olduğunu ve byklğne göre oldukça iyi işler ortaya çıkardığını belirten Prof. Dr. Amasyalı, sözlerini şöyle srdrd:
"İki trl erişim mmkn. Birincisi; online bir web sayfası var. İkincisi; firmalar açık ağırlık olarak yayınladığımız modeli kendi bilgisayarlarına indirip, kendi sreçlerine dahil ederek rahatça kullanabiliyor. TBİTAK projeleri kapsamında geliştirme maliyetini, Trkçesinin iyileştirme maliyetini biz karşılıyoruz. Firmalar da Trkçesi iyileştirmiş olan modelleri kendi sreçlerinde rahatlıkla kullanabiliyor."
"Önce dşnp sonra cevap vermesi performansı artırıyor"
Cosmos T1'in Google'ın yapay zeka modeli Gemma 2 modelinin zerine geliştirildiğini belirten Amasyalı, "Fakat Trkçesini biz burada çok çok iyileştirmeyi dşndk ve ‘thinking' dşnen bir model geliştirdik. Gemma 2 modelinde temelde böyle bir özellik yok. Gemma 2 soru sorunca cevap veren bir model. Cosmos T1'de ise bir dşnce sreci ve onun arkasından bir cevap retme sreci var ki bu da modellerin performansını çok artırıyor. Önce dşnp sonra cevap verdiğinde direkt cevaba geçmektense çok daha iyi bir performans sergiliyor" ifadelerini kullandı.
“Kendisinden 3 kat byk modellerle yarışabiliyor”
Prof. Dr. Mehmet Fatih Amasyalı, "Cosmos T1 zerine oldukça sağlam bir eğitim gerçekleştirdik ve onu dşnmeyen bir modelden dşnen bir model haline getirdik. Bu sayede de kendisinden 3 kat byk olan modellerle yarışabilecek seviyeye ulaştı. Bu başarı da sosyal medyada epey ilgi görd. Aslında çok isteyince ve çalışınca oluyor. Sağlam bir ekiple ve byk bir motivasyonla bunları gerçekleştirdik. TBİTAK'ın arkamızda olması en byk motivasyonumuzdu" diyerek sözlerini sonlandırdı.