DeepSeek-V3-0324 resmen tanıtıldı! İşte tüm yenilikler

Çin merkezli yapay zeka teşebbüsü DeepSeek, MIT lisansı ile yayınladığı yeni büyük lisan modeli DeepSeek-V3-0324’ü kullanıcıların erişimine açtı. Model, Hugging Face platformunda fiyatsız olarak indirilebiliyor ve ticari kullanım için de büsbütün açık …

REKLAM ALANI

Serhat ÖZTÜRK

Yayınlama: 26.03.2025

A⁺

A^-

Yeni DeepSeek-V3-0324 görücüye çıktı

641 gigabayt boyutundaki model, bilhassa tüketici sınıfı donanımlarda çalışabilir olmasıyla dikkat çekiyor. Apple’ın M3 Ultra çipine sahip Mac Studio aygıtlarında bile sıkıntısız formda çalıştığı belirtilen teknoloji, 685 milyar parametreli bir yapıya sahip.

https://twitter.com/hakki_alkan/status/1904553879250804899

Yapay zeka araştırmacısı Xeophon, bu modelin Anthropic’in Claude Sonnet 3.5 modeline önemli bir rakip olabileceğini belirtiyor. Bilhassa Sonnet’in abonelikle sunulmasının bilakis, DeepSeek-V3-0324’ün büsbütün fiyatsız bir biçimde erişilebilir olması büyük fark yaratacak.

ChatGPT kullanmak yalnızlık hissini artırıyor! Pekala neden?

Yapılan bir araştırmaya nazaran, ChatGPT kullanmak kimi şahıslarda yalnızlık hissini artırıyor. Bu durum, birçok telaşa yol açtı.

Model, Mixture of Experts (MoE) mimarisine dayanıyor. Klasik büyük lisan modellerinin bilakis, DeepSeek-V3-0324 sadece en gerekli parametreleri aktifleştiriyor. 685 milyar parametreden sadece yaklaşık 37 milyarı etkin hale getiriliyor.

Bu yaklaşım, hesaplama mühletini önemli biçimde azaltırken performanstan da ödün vermiyor. Performans testlerinde, daha büyük ve daha ağır aktifleştirme yapan modellerle epeyce misal sonuçlar elde edildi.

DeepSeek-V3-0324 ayrıyeten Multi-Head Latent Attention (MLA) ve Multi-Token Prediction (MTP) üzere iki kıymetli yenilik içeriyor. MLA, uzun metinler ortasında bağlamı muhafaza yeteneğini geliştirirken, MTP her adımda birden fazla token üretme imkanı sağlıyor.

Bu teknolojiler, modelin çıktı suratını yaklaşık yüzde 80 oranında artıracak. Apple araştırma kümesinden Awni Hannun, modeli Mac Studio üzerinde test ederek saniyede yaklaşık 20 token suratında çıktı ürettiklerini açıkladı.

Kullanıcılar, modelin irtibat usulünde evvelki sürümlere kıyasla besbelli bir değişiklik olduğunu belirtiyor. Daha evvel insan gibisi ve konuşkan bir tona sahip olan DeepSeek modellerinin bilakis, V3-0324 daha resmi ve teknik bir üsluba sahip.

DeepSeek’in bu atılımı, büyük lisan modelleri ortasındaki rekabeti yeni bir boyuta taşıdı. Pekala siz bu mevzu hakkında ne düşünüyorsunuz? Görüşlerinizi aşağıdaki yorumlar kısmından bizimle paylaşabilirsiniz.

Kaynak : Shiftdelete

Modeli

REKLAM ALANI

Serhat ÖZTÜRK

Gündem'den Olan Tüm haberleri buradan Takip Edebilirsiniz.

Benzer Konular

Oyunlar kapandı: PlayStation Network çöktü mü?

Vakit zaman yaşanan meseleler nedeniyle oyuncular mağdur olmaya devam ediyor. Gece saatlerinde yaşanan bir kesinti nedeniyle PlayStation Network (PSN) sunucuları çöktü. Oyuncular tarafından ağır tenkitler alan sisteme erişim meseleleri hala devam ...

08.02.2025

iPhone 17 serisi, kamerasıyla fark yaratacak!

Apple’ın iPhone 17 serisi, 24MP’lik ön kamerayla geliyor. Mevcut modellerde 12MP çözünürlüklü bir selfie kamerası kullanan şirket, yeni serinin tüm modellerinde bu değişikliği uygulayacak. Bu güzelleştirmenin, bilhassa selfie ve görüntü çekimlerinde ...

19.03.2025

Sony, PS5 aksesuarları için yepisyeni bir renk seçeneği duyurdu!

Sony, PS5 5 aksesuar serisine Midnight Black (Gece Yarısı Siyahı) isimli yeni bir renk seçeneği ekledi. PlayStation Portal, DualSense Edge, Pulse Seçkine ve Pulse Explore üzere tanınan aksesuarlar, artık siyah renk dizaynıyla sunulacak. Oyuncuların uzun ...

17.01.2025

Merakla beklenen oyunun fiyatı cep yakacak!

Hideo Kojima’nın merakla beklenen yeni oyunu Death Stranding 2: On the Beach, PlayStation Store’da ön siparişe açıldı. Oyunun Türkiye fiyatı belirli olurken, açıklanan sayılar oyunseverlerin dikkatini çekti. İki farklı sürümle satışa sunulan oyunun ...

18.03.2025

Xiaomi Buds 5 Pro için geri sayım başladı! Heyecanlandıran özellik ortaya çıktı

Akıllı telefondan taşınabilir uygulamaya, dizüstü bilgisayardan giyilebilir aygıtlara, TV’lerden konut eşyalarına kadar pek çok alanda üretim yapan Xiaomi, Buds 5 serisini küresel pazara sunduktan sonra artık de yeni kuşak amiral gemisi kablosuz ...

20.02.2025

Nvidia’dan resmi duyuru: RTX 5090 karaborsaya düşecek!

Nvidia, yeni jenerasyon ekran kartları GeForce RTX 5090 ve RTX 5080 için büyük bir talep beklediğini ve stok badiresinin yaşanabileceğini resmi olarak duyurdu. Hatta şirket, bu durumu önlemek ismine ortaklarıyla birlikte sistemli olarak perakendecilere ...

29.01.2025

Bir Yorum Yazın

[ Yoruma cevap yazmaktan vazgeç ]

Ziyaretçi Yorumları - 0 Yorum

Henüz yorum yapılmamış.