OpenAI o3 yapay zeka modelini duyurdu! Neler sunuyor?

OpenAI, 12 günlük “Shipmas” aktifliğinin son gününde büyük bir duyuru yaparak yeni o3 model ailesini tanıttı. Aslında bu model ailesi, yılın başlarında piyasaya sürülen o1 “mantık yürütme” modelinin bir halefi. o3 ve daha küçük bir versiyonu olan 03 …

OpenAI o3 yapay zeka modelini duyurdu! Neler sunuyor?
reklam
Yayınlama: 21.12.2024
1
A+
A-

OpenAI, 12 günlük “Shipmas” aktifliğinin son gününde büyük bir duyuru yaparak yeni o3 model ailesini tanıttı. Aslında bu model ailesi, yılın başlarında piyasaya sürülen o1 “mantık yürütme” modelinin bir halefi. o3 ve daha küçük bir versiyonu olan 03-mini modelinin belli vazifeler için ziyadesiyle optimize edildiği söyleniyor. Detaylar haberimizde…

OpenAI yeni o3 modeli ile neredeyse Yapay Genel Zeka’ya yaklaştı!

Şirket, o3 modelinin kimi şartlarda Yapay Genel Zekaya (AGI) yaklaştığını sav ediyor. Lakin bu argüman, şimdilik birtakım kuşkulara ve çekingelere sahip. Zira şimdi gereğince test edilmedi. o3 modeli, bir “mantık yürütme” modeli olarak öbür yapay zekalardan biraz daha farklı. İşte o3’ün öne çıkan özellikleri:

reklam

reklam
  • Özel fikir zinciri: Model, bir misyonu tamamlamadan evvel düşünme sürecini simüle ediyor, bir dizi aksiyonu planlıyor ve tahlile ulaşmak için ilgili mevzuları kıymetlendiriyor.
  • Değişken düşünme müddeti: Kullanıcılar, düşük, orta yahut yüksek seviyede hesaplama mühleti (düşünme zamanı) seçerek modelin performansını ayarlayabiliyor.
  • Kendi kendini doğrulama: Model, verdiği yanıtları kendi içinde denetim ederek daha yanlışsız sonuçlara ulaşıyor.

Google, akıl yürüten Gemini yapay zeka modelini tanıttı!

Google, Gemini 2.0 Flash Thinking isminde akıl yürüterek çalışan yeni yapay zeka modelini duyurdu. İşte ayrıntılar…

Yine de, o3 fizik, matematik ve bilim üzere alanlarda daha muteber tahliller sunarken, öteki modellere kıyasla daha uzun sürüyor. OpenAI, o3’ün birtakım testlerde AGI’ye yakın sonuçlar verdiğini belirtiyor. Örneğin, o3, ARC-AGI isimli bir testte yüksek süreç gücü ayarında %87,5 muvaffakiyet elde etti. Bu, bir yapay zeka sisteminin eğitim datalarının ötesinde yeni hünerler kazanma yeteneğini ölçüyor.

Benchmark testlerinde zirvede

o3, farklı benchmark testlerinde etkileyici sonuçlar aldı. SWE-Bench Verified testinde %22,8’lik bir artış gösterdi. Amerikan Matematik Sınavı’nda ise %96,7 muvaffakiyet sağladı, yalnızca bir soruyu kaçırdı. Graduate seviye biyoloji, fizik ve kimya sorularından oluşan GPQA Diamond setinde %87,7 muvaffakiyet elde etti.

o3 modelinin, ilerleyen günlerde bağımsız testler ve kullanıcı tecrübeleri, modelin gerçek potansiyelini daha güzel gösterecek. Bu mevzuda siz ne düşünüyorsunuz? Görüşlerinizi aşağıdaki yorumlar kısmına yazabilirsiniz…

Kaynak : Shiftdelete

reklam
Bir Yorum Yazın

Ziyaretçi Yorumları - 0 Yorum

Henüz yorum yapılmamış.