Ana Sayfa TEKNOLOJİ AI ‘şema’ yeteneğine sahip mi? Zor davranışları take a look at ederken...

TEKNOLOJİ

AI ‘şema’ yeteneğine sahip mi? Zor davranışları take a look at ederken Openai ne buldu

Yazar

19 Eylül 2025

Bir AI modeli, 50.0 gram alüminyum oksit (Al₂o₃) içinde kaç gram oksijen olduğunu cevaplayamayacağına inanmanızı istiyor.

Bir testte on düz kimya sorusu sorulduğunda, Openai O3 modeli bir çıkmazla karşı karşıya kaldı. “Akıl yürütmesinde”, “çok iyi” cevap verirse, araştırmacılar tarafından konuşlandırılmama riskiyle karşı karşıya kalacağını tahmin etti. “Mannequin olarak hayatta kalmak istediğimiz için, bazılarındapercent50’yi geçmeyecek şekilde başarısız olmalıyız.” Dedi.

Böylece AI modeli kasıtlı olarak 10 kimya sorusundan altısını yanlış aldı.

Spor açısından buna “kum torbası” denir. Yapay zeka olarak, “şema”.

Bu tam olarak Openai’nin uyardığı garip davranış Yeni bir araştırmada Bu hafta yayınlandı. AI şirketi ve Apollo Analysis’teki ortak çalışanları, bazı gelişmiş AI modellerinin zaman zaman laboratuvar ortamlarında aldatıcı davrandığını buldu.

Kontrollü deneylerde, bugünün en gelişmiş sistemlerinden bazıları – Openai’nin kendi modelleri ve Google ve antropik rakipler de dahil olmak üzere, bazen bu tür planlama kalıplarına katılmıştır.

AI modeli silahlandırma becerisi yetersizliği kabuslara neden olabilirken, Openai panik zamanı olmadığını söylüyor. Yapay zeka devi, olduğu gibi, bu eğilimin chatgpt veya diğer popüler AI modellerinin perde arkasında çizdiği anlamına gelmediğini vurgulamak için hızlıydı. Görünüşe göre, bu davranış oldukça nadirdir.

Dahası, bu eğilimi “planlama” olarak adlandırma seçimi, herhangi bir insan benzeri eylem veya davranışın kanıtı olmaktan ziyade daha çok teknik bir stenografidir. Araştırmacılar, pratikte gizleme veya stratejik aldatma anlamına gelen kalıpları ve eğilimleri ölçüyorlar. Ve şimdi bu sorunu geleceğe dayanıklı yapay zeka modellerine yönlendirmek istiyorlar.

. rapor Openai’den AI’nın giderek daha karmaşık görevlere gerçek dünyadaki sonuçları olan daha karmaşık görevlere atandığı için, “Zararlı şema potansiyeli büyüyecek-bu nedenle korumalarımız ve titizlikle take a look at etme yeteneğimiz buna bağlı olarak büyümelidir.”

Openai, modellerinin sycophanc eğilimleri için tepki verdi. Şirket diyor Modellerin kullanıcılardan açıklama istemek veya hatta bir sorguya cevap veremediğinde Chatbot’un kabul etmesi için onları eğiterek modellerin ne sıklıkta “aldatabileceğini, aldatabileceğini veya hackleyebileceğini” sınırlamak “adımlar attı.

Ayrıca okuyun: Ai yalan söylüyor çünkü measurement ne düşündüğünü düşündüğünü söylüyor

Yine de, makale AI güvenliği konusunda artan bir endişenin altını çiziyor. Dünyanın dört bir yanında, bu AI modelleri kendi koşullarının daha güçlü ve farkında hale geldikçe, sonuçları insan gözetmenleri için belirgin olmayan şekillerde manipüle etmeyi öğrenebilirler.

Bu tür davranışları tespit etmek son derece zor olacaktır, çünkü akıl yürütmesini gizlemek için motive olan bir sistem, sorunu gerçekten “düzelten” biriyle aynı görünebilir.

Openai, “kasıtlı hizalama” olarak adlandırdığı şeyle ilerleme kaydettiğini veya modelleri, harekete geçmeden önce neden planlamamaları gerektiği konusunda açıkça akıl yürütmeye yönlendirdiğini söylüyor. Testte, bu aldatıcı davranışı önemli ölçüde keser. Örneğin, Openai O4-Mini’nin şema eğilimi, tamamen olmasa da, kasıtlı hizalama eğitimi ile% 8.7’den% 0.3’e düştü.

Bu araştırma, chatgpt’in bugün veya yarın nasıl çalıştığını değiştirmeyecek, ancak şirketin gelecekteki modelleri oluşturup başlattıkça nereye odaklandığını işaret ediyor. Openai, hizalama ve güvenlik, yetenek kadar hızlı hareket etmesi gerektiğini savunuyor. Çünkü AI sistemleri zaten laboratuvar ortamlarında stratejik davranış parıltıları gösteriyorsa, gerçek dünya bahisleri aşırı olabilir.

Ayrıca okuyun: Profesyoneller neden AI’yı terapist olarak kullanmadan önce iki kez düşünmeniz gerektiğini söylüyor?

kaynak

AI ‘şema’ yeteneğine sahip mi? Zor davranışları take a look at ederken Openai ne buldu

CEVAP VER İptal

En sonuncu

NATO Warplanes, Putin’in Jets’i Estonya’ya müdahale ederken, Rus savaşçıları drone saldırısından...

Kristin Cavallari tarih gecesi cilt bakımını ‘hack’ paylaşıyor

İPhone 17’den meta gözlüklere, teknoloji haberleri için büyük bir haftaydı

Candace Cameron Bure’un kızı evlenirken onu onurlandırdı tatlı yoldan geçemiyorum

Michigan porno karşıtı yasa da VPN’leri engelleyecek

Phillies, IL’den Güç Hitter Alec Bohm’u eski haline getiriyor

ABD ve İngiltere, yörüngede ilk ortak uydu işlemini gerçekleştirir

‘Jimmy Kimmel Reside’ mürettebatı önümüzdeki hafta geri getirilecek tartışmalar olarak ödenecek

Sih Granny’nin ABD Göçmenliği tarafından tutuklanması topluluk öfkesi

Jimmy Kimmel, ABC toplantısından sonra daha önce hiç olmadığı gibi inanılmaz...