OpenAI, Profesyoneller İçin Yeni GPT-5.4 Modelini Tanıttı

2 hafta önce 6

Yapay zekâ alanında küresel yarış hız kesmeden devam ediyor. OpenAI, GPT-5.4 adlı yepyeni kuşak ilköğretim modelini duyurdu. “Profesyonel işler için şimdiye kadarki en güçlü ve tesirli model” olarak tanıtılan sistem, Pro ve Thinking adlı ikisi farklı sürümle geliyor. Yeni modeller daha geniş bağlam penceresi, dahaaz yanlışlı oranı ve gelişmiş icra testleriyle ilgi çekiyor.

Detaylar haberleriimizde…

OpenAI’dan yepyeni kuşak model: GPT-5.4

Yapay zekâ teknolojileri alanında öncü şirketlerden arasında biri olan OpenAI, perşembe günü yepyeni kuşak ilköğretim yapay zekâ modeli GPT‑5.4’ü resmen duyurdu. Şirket, GPT-5.4’ü “profesyonel iş akışları için geliştirilmiş en kabiliyetli ve en tesirli sınır modeli” olarak tanımlıyor.

Yeni modeller yalnızca norm sürümle sınırlı değil. OpenAI, GPT-5.4’ü ikisi farklı varyasyonla kullanıma sunuyor. Bunlardan ilki akıl yürütme ve çok adımlı sualn çözme yeteneklerine odaklanan GPT‑5.4 Thinking sürümü. Diğeri ise yüksek icra ve hız için optimize edilen GPT‑5.4 Pro versiyonu.

Şirketin açıklamasına göre bu üç farklı yapılandırma, yazılım geliştirmeden mali analizlere, hukuki ttesirklerden bilgi işleme süreçlerine kadar pek çok mesleki kullanım senaryosuna yönelik tasarlandı.

1 milyon token’lık kocaman bağlam penceresi

Yeni modelin en ilgi çekici özelliklerinden biri, geliştiriciler için sunulan API sürümündeki bağlam kapasitesi. OpenAI, GPT-5.4’ün 1 milyon token’a kadar bağlam penceresi yardımleyebildiğini açıkladı. Bu değer, şirketin şimdiye kadar sunduğu en büyük bağlam penceresi olarak öne çıkıyor.

Daha geniş bağlam penceresi, yapay zekânın tekbaşına seferde çok daha uzunluğu belgeleri çözümleme edebilmesi manaına geliyor. Bu sayede araştırma raporları, uzunluğu şifre tabanları ya da içeriklı bilgi setleri üzerinde çalışmak mümkün hale geliyor.

OpenAI ayrıca yepyeni modelin token verimliliğinde önemli iyileştirmeler sunduğunu belirtti. Şirkete göre GPT-5.4, önceki modeller olan GPT‑5.2 ile karşılaştırıldığında aynı sualnlerin çözümünde çok dahaaz token kullanabiliyor. Bu şart hem işlem maliyetlerini düşürüyor hem da daha hızlı yanıt süreleri sağlıyor.

Performans testlerinde rekor sonuçlar

GPT-5.4, çeşitli icra testlerinde elde ettiği sonuçlarla da ilgi çekti. Model, malumatsayar kullanım becerilerini ölçen OSWorld‑Verified ve WebArena Verified testlerinde rekor puanlara ulaştı.

Bunun yanında OpenAI’nin malumat temelli iş görevlerini ölçmek için geliştirdiği GDPval değerlendirmesinde modeller yüzde 83 başarı oranı elde etti. Bu test; bildiri yazımı, çözümleme üretimi ve karmaşık metinleri oluşturma gibi görevleri ölçüyor.

Profesyonel becerileri testleri etmek için geliştirilen APEX‑Agents Benchmark testinde da GPT-5.4 liderliği ele geçirdi. Test; özellikle hukuk ve maliye alanlarında çalışan yapay zekâ sistemlerinin performansını ölçmek amacıyla hazırlanıyor.

Testi geliştiren şirketin CEO’su Brendan Foody, modelin uzunluğu vadeli görevlerde güçlü icra sergilediğini söyledi. Foody, GPT-5.4’ün “sunum dosyaları hazırlama, mali modeller oluşturma ve hukuki çözümleme üretme gibi karmaşık ve uzunluğu süreçli görevlerde öne çıktığını” belirtti.

Daha dahaaz yanlış, daha güvenilir yanıtlar

Photo credit: Bloomberg

OpenAI, yepyeni modelle birlikteki yanlışlı malumat üretimini azaltmaya yönelik çalışmaların da sürdüğünü açıkladı. Şirketin paylaştığı verilere göre GPT-5.4, GPT-5.2’ye kıyasla:

  • Tekil iddialarda %33 dahaaz yanlışlı yapıyor
  • Genel yanıtlarında %18 dahaaz yanlış malumat içeriyor

Yapay zekâ modellerinin zamanlar zaman gerçek olmayan ya da yanlış malumatler üretmesine “halüsinasyon” adı veriliyor. OpenAI, GPT-5.4’ün bu sualnu azaltmaya yönelik önemli tek adım olduğunu vurguluyor.

Yeni araç sistemi ve güvenlik testleri

Modelin geliştirici sürümünde önemli tek yenilik daha bulunuyor. OpenAI, araç çağırma sistemini yeniden tasarlayarak Tool Search adlı yepyeni tek düzenek ekledi.

Eski sistemde, yapay zekâya kullanılabilecek tüm araçların tanımlarının baştan verilmesi lüzumiyordu. Bu yöntem, özellikle çok sayıda araç içeren sistemlerde yüksek token tüketimine yolda açabiliyordu. Yeni sistemde ise model, ihtiyaç duyduğu araçların tanımlarını lüzumtiği anda arayabiliyor. Böylece hem hız hem da bedel avantajı sağlanıyor.

Şirket ayrıca yepyeni modeller için ilave güvenlik değerlendirmeleri yaptığını da açıkladı. Bu testler, yapay zekâ modellerinin çok adımlı görevlerde kullandığı düşünme süreci açıklamalarını — diğer “chain-of-thought” mekanizmasını — çözümleme ediyor.

Araştırma sonuçlarına göre GPT-5.4’ün Thinking sürümünde aldatıcı akıl yürütme davranışlarının görülme olasılığı daha düşük. Bu durum, modelin düşünme sürecini gizleme kapasitesinin sınırlı olduğunu ve şimdiki güvenlik denetimlerinin tesirli olduğunu gösteriyor.

Uzmanlara göre yarış daha da kızışacak

Yapay zekâ alanındaki hızlı gelişim, teknolojiler şirketleri arasındaki rekabeti da gittikçe artırıyor. Özellikle mesleki kullanım senaryolarına odaklanan yepyeni modeller, iş dünyasında yapay zekâ yardımli üretkenlik araçlarının daha yaygın hale geleceğini gösteriyor.

Uzmanlar, GPT-5.4 gibi gelişmiş modellerin yalnızca içerik üretimi değil; mali analiz, yazılım geliştirme, hukuki değerlendirme ve bilgi araştırması gibi alanlarda da önemli görev oynayacağını belirtiyor. Bununla birlikteki yapay zekâ sistemlerinin güvenilirliği, şeffaflığı ve ahlak kullanımı başlıksundaki tartışmaların da önümüzdeki dönemde ilave gündeme gelmesi bekleniyor.

>> Tüm Makaleyi Oku <<

Platformumuz; Teknoloji, Spor, Sağlık, Eğlence, Uluslararası, Edebiyat, Bilim ve daha fazlası olmak üzere farklı konu başlıkları altında, kısa ve öz haber formatı ile kullanıcıların zamandan tasarruf etmesini hedefler. Karmaşadan uzak, sade ve anlaşılır içerik yapısı sayesinde ziyaretçiler aradıkları bilgiye hızlıca ulaşabilir. techforum.com.tr, bilgi kirliliğini önleyerek yalnızca güvenilir kaynaklardan elde edilen içerikleri yayınlamaya özen gösterir.