OpenAI, GPT-4o modelinin yeni görsel oluşturma özelliklerini duyurdu. Şirketin açıklamasına nazaran GPT-4o evvelki modellere nazaran çok daha hassas, detaylı ve gerçekçi görseller üretme yeteneğine sahip. Bu özellik sayesinde kullanıcılar yalnızca kolay …
OpenAI, GPT-4o modelinin yeni görsel oluşturma özelliklerini duyurdu. Şirketin açıklamasına nazaran GPT-4o evvelki modellere nazaran çok daha hassas, detaylı ve gerçekçi görseller üretme yeteneğine sahip. Bu özellik sayesinde kullanıcılar yalnızca kolay komutlarla istedikleri görselleri oluşturabilecek, düzenleyebilecek yahut mevcut görseller üzerinden yeni dizaynlar geliştirebilecek.
GPT-4o ile görsel oluşturmada yeni dönem!
OpenAI görsel oluşturma yeteneğinin lisan modelleri için temel bir marifet olması gerektiğini uzun müddettir savunuyor. GPT-4o da bu niyet doğrultusunda geliştirilen şirketin şu ana kadarki en gelişmiş ve kullanışlı görsel oluşturma sistemi. GPT-4o ile yaratılan görseller sadece estetik açıdan değil, bilgi transferi açısından da hayli kullanışlı hale geldi.
Yeni model kullanıcıların verdiği komutları daha yanlışsız formda anlayıp görsellere daha hassas biçimde uyguluyor. Bilhassa karmaşık ve çok objeli görsellerde GPT-4o rakiplerine nazaran daha düzgün performans gösteriyor.
Örneğin, model artık 10 ila 20 farklı nesneyi tek bir görsel içerisinde dengeli biçimde bir ortaya getirebiliyor. Ayrıyeten modelin görsellerdeki metinleri ve sembolleri hakikat formda işleyebilme özelliği sayesinde logolar, diyagramlar, infografikler üzere bilgilendirici görselleri üretmek çok daha kolay hale geliyor.
OpenAI’nin paylaştığı örnekler ortasında, beyaz tahtada yapılan toplantı notları, çizgi romanlar, bilimsel deneylerin detaylı infografikleri ve manalı metinlerle desteklenen görseller bulunuyor. Şirketin açıklamasında, görsel oluşturmanın yalnızca dekoratif emelli değil, bilgi paylaşımı ve irtibatta de güçlü bir araç olarak kullanılması gerektiği vurgulandı.
Yeni GPT-4o modeli, çok adımlı görsel üretimi özelliğine de sahip. Bu sayede kullanıcılar, oluşturdukları görselleri doğal bir sohbet üzerinden modelle birlikte geliştirebiliyor. Örneğin, bir oyun karakterinin tasarımı adım adım şekillendirilebilir ve her adımda karakterin tutarlılığı korunabilir.
GPT-4o, kullanıcının yüklediği görselleri tahlil ederek bu görsellerden yeni görseller türetebilme yeteneğine de sahip. Bu özellik, modeli kullanıcılar için daha sezgisel ve şahsileştirilmiş bir araç haline getiriyor. OpenAI’ye nazaran, GPT-4o modelinde kullanılan imgelerin çeşitliliği ve tarzı, modelin foto-gerçekçi görseller oluşturabilmesine ve görsel dönüşümleri ikna edici biçimde gerçekleştirebilmesine imkân sağlıyor.
OpenAI, yeni modelin şimdi birtakım sınırlamalara sahip olduğunu kabul ediyor. Bilhassa küçük boyutlu yazılar içeren çok ağır bilgi barındıran grafikler yahut çoklu lisanlar içeren görsellerde kimi sınırlamalar bulunuyor. Ayrıyeten bazen istenmeyen görsel kırpmaları ve tutarsızlıklar üzere sorunların yaşanabileceği söz edildi. Şirket, gelecekte bu bahislerde iyileştirmeler yapılacağını belirtti.
OpenAI, görsel oluşturma özelliğini inançlı hale getirmek için çeşitli tedbirler aldığını da duyurdu. GPT-4o tarafından üretilen tüm görsellere, içeriğin kaynağının OpenAI olduğunu belirten C2PA meta bilgileri ekleniyor. Bu sayede oluşturulan içeriklerin özgünlüğü daha kolay bir formda doğrulanabiliyor. Ayrıyeten ziyanlı içerik taleplerinin otomatik olarak engellendiği vurgulandı.
Bugünden itibaren GPT-4o’nun görsel oluşturma özellikleri ChatGPT’de Plus, Pro, Team ve fiyatsız kullanıcılar için varsayılan seçenek olarak sunulmaya başlandı. Enterprise ve Edu kullanıcıları da kısa müddet içinde bu özellikten yararlanabilecek.
DALL·E severler için ise bu model hala özel bir DALL·E GPT üzerinden kullanılabilecek. Ayrıyeten geliştiriciler önümüzdeki haftalarda API aracılığıyla GPT-4o’nun görsel oluşturma özelliğini kullanabilecek.
Tüm ayrıntılar için burayı tıklayabilirsiniz.
Kaynak : Shiftdelete