OpenAI, 12 günlük “Shipmas” aktifliğinin son gününde büyük bir duyuru yaparak yeni o3 model ailesini tanıttı. Aslında bu model ailesi, yılın başlarında piyasaya sürülen o1 “mantık yürütme” modelinin bir halefi. o3 ve daha küçük bir versiyonu olan 03 …
OpenAI, 12 günlük “Shipmas” aktifliğinin son gününde büyük bir duyuru yaparak yeni o3 model ailesini tanıttı. Aslında bu model ailesi, yılın başlarında piyasaya sürülen o1 “mantık yürütme” modelinin bir halefi. o3 ve daha küçük bir versiyonu olan 03-mini modelinin belli vazifeler için ziyadesiyle optimize edildiği söyleniyor. Detaylar haberimizde…
OpenAI yeni o3 modeli ile neredeyse Yapay Genel Zeka’ya yaklaştı!
Şirket, o3 modelinin kimi şartlarda Yapay Genel Zekaya (AGI) yaklaştığını sav ediyor. Lakin bu argüman, şimdilik birtakım kuşkulara ve çekingelere sahip. Zira şimdi gereğince test edilmedi. o3 modeli, bir “mantık yürütme” modeli olarak öbür yapay zekalardan biraz daha farklı. İşte o3’ün öne çıkan özellikleri:
Google, akıl yürüten Gemini yapay zeka modelini tanıttı!
Google, Gemini 2.0 Flash Thinking isminde akıl yürüterek çalışan yeni yapay zeka modelini duyurdu. İşte ayrıntılar…
Yine de, o3 fizik, matematik ve bilim üzere alanlarda daha muteber tahliller sunarken, öteki modellere kıyasla daha uzun sürüyor. OpenAI, o3’ün birtakım testlerde AGI’ye yakın sonuçlar verdiğini belirtiyor. Örneğin, o3, ARC-AGI isimli bir testte yüksek süreç gücü ayarında %87,5 muvaffakiyet elde etti. Bu, bir yapay zeka sisteminin eğitim datalarının ötesinde yeni hünerler kazanma yeteneğini ölçüyor.
Benchmark testlerinde zirvede
o3, farklı benchmark testlerinde etkileyici sonuçlar aldı. SWE-Bench Verified testinde %22,8’lik bir artış gösterdi. Amerikan Matematik Sınavı’nda ise %96,7 muvaffakiyet sağladı, yalnızca bir soruyu kaçırdı. Graduate seviye biyoloji, fizik ve kimya sorularından oluşan GPQA Diamond setinde %87,7 muvaffakiyet elde etti.
o3 modelinin, ilerleyen günlerde bağımsız testler ve kullanıcı tecrübeleri, modelin gerçek potansiyelini daha güzel gösterecek. Bu mevzuda siz ne düşünüyorsunuz? Görüşlerinizi aşağıdaki yorumlar kısmına yazabilirsiniz…
Kaynak : Shiftdelete