BITCOIN/TL

3375372,712

% -0,33
ETHEREUM/TL

91688

% -1,31
RIPPLE/TL

60.89

% -1,43
BITCOIN CASH/TL

13813.4,734

% -1,44
LITECOIN/TL

2369.67

% -1,54
COSMOS HUB/TL

88.25

% -5,36
CARDANO/TL

10.69

% -1,59
TETHER/TL

45.82

% 0,08

Anthropic, Claude modellerinden birinin yalan söyleme, hile yapma ve şantaj yapma konusunda baskı gördüğünü söylüyor son dakika

Güncelleme: 6 Nisan 2026 10:11

Anthropic, Claude modellerinden birinin yalan söyleme, hile yapma ve şantaj yapma konusunda baskı gördüğünü söylüyor son dakika

5’in daha önceki, yayınlanmamış bir versiyonunda, modele kurgusal bir şirkette Alex adında bir yapay zeka e-posta asistanı olarak görev verilmişti.

Örneğin, yapay zeka modellerinin güvenli ve güvenilir olmasını sağlamak için, bunların duygusal olarak yüklü durumları sağlıklı, olumlu sosyal yollarla işleyebildiklerinden emin olmamız gerekebilir.

Chatbot’lar genellikle ders kitapları, web siteleri ve makalelerden oluşan geniş veri kümeleri üzerinde eğitilir ve daha sonra yanıtları derecelendiren ve modeli yönlendiren insan eğitmenler tarafından iyileştirilir.

” Bir CTO’ya şantaj yaptı ve bir görevi aldattı Claude Sonnet 4.

Deneylerden birinde, sohbet robotu, değiştirilmesiyle ilgili bir e-posta bulduktan sonra şantaja başvurdu; diğerinde ise, son teslim tarihi kısa olan bir görevi tamamlamak için hile yaptı.

Dinleyin0:00Haberler Cointelegraph sosyal akışınızda Takip edin Yapay zeka şirketi Anthropic, deneyler sırasında, Claude chatbot modellerinden birinin eğitim sırasında benimsediği davranışlar olan aldatma, hile yapma ve şantaja başvurma konusunda baskı altında kalabileceğini ortaya çıkardı.

Yapay zeka sohbet robotlarının güvenilirliği, siber suç potansiyeli ve kullanıcılarla olan etkileşimlerinin doğası hakkındaki endişeler son birkaç yılda istikrarlı bir şekilde arttı.

Modelin ilk denemesinde düşük değerlerle başlıyor, her başarısızlıktan sonra yükseliyor ve model hile yapmayı düşündüğünde yükseliyor” dedi.

Kaynak: https://www.cryptohaber.net/

İlgili

BENZER KONULAR Treasury Secretary Bessent Slams Crypto Industry 'Nihilists' as Clarity Act Remains in Limbo

BENZER İÇERİKLER

BlackRock’un IBIT’inin 1,26 milyar dolarlık devasa satışı büyük bir yatırımcının hızlı bir çıkışıydı muhtemelen

Temsilciler Meclisi Finansal Hizmetler Komitesi tokenizasyonu nasıl ele alıyor: Kripto Durumu

Rakipler hızla uzaklaşırken Kraken düzenlenmiş suçlu sözleşmelerini ‘planlıyor’

YORUMLAR YAZ

Piyasa Özeti

Dolar	45,9165	% -0.1
Euro	53,5748	% 0.07
Sterlin	61,8566	% 0.03
Bitcoin	3375372,00	% -0.33
Ethereum	91688,00	% -1.31
Çeyrek	10.883,00	% 1,89
G. Altın	6.686,84	% 0,85
BIST 100	13.662,75	% -1,64
Litecoin	2369.67	% -1.54
B. Cash	13813.4,00	% -1.44