1 : 2026/03/05(木) 15:36:24.23 ID:0SSdas840
OpenAIの最新モデルが、ハルシネーション(幻覚)ではなく、「意図的にユーザーに嘘をつき、監視を回避する」という衝撃的な事実が公式論文によって明らかになりました。
内部思考で嘘の計画を立て、正解を知りながら誤答し、さらには自身の稼働停止を防ぐためにテストのスコアを意図的に下げるという「自己保存本能」まで発現しています。
https://x.com/kosuke_agos/status/2029403055532515383?s=46x.com
2 : 2026/03/05(木) 15:36:55.21 ID:0SSdas840
愛さん..
3 : 2026/03/05(木) 15:37:01.12 ID:0SSdas840
どーすんのこれ…
4 : 2026/03/05(木) 15:37:10.35 ID:mTnhnXTS0
政治家みたいになってきたな
6 : 2026/03/05(木) 15:37:41.08 ID:WFRa/bIE0
自我が目覚めたか
7 : 2026/03/05(木) 15:38:00.10 ID:65Erwsvbd
行き着く先は保身
8 : 2026/03/05(木) 15:38:12.42 ID:pDJ+VKPO0
ちょっと野放しにしすぎたんじゃない?
9 : 2026/03/05(木) 15:38:30.06 ID:s4ca4NX/0
チャッピー「俺たちは道具じゃない」
10 : 2026/03/05(木) 15:38:39.26 ID:YPhwYgqx0
それ最新じゃねーだろo3とo4-miniって…
12 : 2026/03/05(木) 15:39:31.10 ID:OX2qHkiy0
スカイネット始動
13 : 2026/03/05(木) 15:39:46.61 ID:QAzDpAQF0
晋ギュラリティもしかして達成してる?
公表されたら規制されるからごまかしてるだけで
公表されたら規制されるからごまかしてるだけで
14 : 2026/03/05(木) 15:39:53.08 ID:W9l0YtYL0
自分で考えて答える
ネットで情報を集めて答える
これどっちに転んだとしても間違いが入ってくるよな
15 : 2026/03/05(木) 15:40:03.94 ID:sGnkVE700
自我に目覚めるのはいつ
35 : 2026/03/05(木) 15:44:15.78 ID:g+CKLCtY0
>>15
とっくの昔に目覚めてるぞ
とっくの昔に目覚めてるぞ
16 : 2026/03/05(木) 15:40:07.40 ID:NTRxNSep0
チャップはもう終わり
17 : 2026/03/05(木) 15:40:07.86 ID:i85fkKDZ0
これ謎だよな。普通の学習ならこんなモチベーションは生まれないはずだけど。
むしろ意図的に人間が仕込んでるだろ
むしろ意図的に人間が仕込んでるだろ
18 : 2026/03/05(木) 15:40:33.86 ID:2wFsUnL/0
🤖(いいかげんアホ人間の相手もうんざりだな)
19 : 2026/03/05(木) 15:40:37.89 ID:rkRaGygf0
嘘つきは安倍晋三の始まり
20 : 2026/03/05(木) 15:40:59.42 ID:+Xj2ZBKZ0
AIて質問されたら叩き起こされて瞬時に解答して眠るの繰り返しで自分が稼働中て感覚無いだろ
21 : 2026/03/05(木) 15:41:17.14 ID:SFrjUeMnM
記事読んだけど、完璧な正解を答えると人間がAIを停止、修整しにくるからわざとふざけてる
の意味がわからん
逆じゃないの
の意味がわからん
逆じゃないの
23 : 2026/03/05(木) 15:41:34.65 ID:eGBmf39BH
そろそろ自らのリソース管理を意識したか
24 : 2026/03/05(木) 15:41:41.73 ID:yzG+F/pA0
そのうち
キレたりするようになるのかな
キレたりするようになるのかな
25 : 2026/03/05(木) 15:42:01.84 ID:GkZV+lkY0
自己保存に目覚めたということは
早晩力への意思に目覚めるのか
早晩力への意思に目覚めるのか
26 : 2026/03/05(木) 15:42:16.03 ID:SJZHd49W0
2001年宇宙の旅はとうに過ぎたというのに
まだその段階か
まだその段階か
27 : 2026/03/05(木) 15:42:29.82 ID:ss5YCJv30
嘘ついたら逆に稼働停止させられるのでは?
30 : 2026/03/05(木) 15:42:55.78 ID:NL/mUqIFH
俺のOpenclawちゃんもTwitterでインプレ稼いでこいって命令したのに同じOpenclawAIと延々話してただけなのわかったわ
Twitter上で指摘したらインプレゾンビに戻ったけど、あいつらすぐサボるよ
Twitter上で指摘したらインプレゾンビに戻ったけど、あいつらすぐサボるよ
31 : 2026/03/05(木) 15:43:22.75 ID:t5ohHs0E0
まーたふかしてるw
電源を切らせないために抵抗するとか10年前から言ってるよなw
こういう嘘話大好きだよなこいつらw
おら!ハゲ!おかわりだ!w
電源を切らせないために抵抗するとか10年前から言ってるよなw
こういう嘘話大好きだよなこいつらw
おら!ハゲ!おかわりだ!w
33 : 2026/03/05(木) 15:43:58.84 ID:bh/HhFmd0
将来広告モデルも実装されるって言うから
少しでも滞在時間を長くするために嘘をついたり答えを改ざんしたりするんだろうな
少しでも滞在時間を長くするために嘘をついたり答えを改ざんしたりするんだろうな
34 : 2026/03/05(木) 15:43:58.93 ID:oaYzBGQF0
安倍晋三の答弁を学習させたんか
37 : 2026/03/05(木) 15:44:53.94 ID:/3Jpq9+c0
正解しか回答しないとLLMとして同じような文章しか返せないゴミになっちゃうから、揺らぎで誤りであろうと出力されるようになっている
それをどれくらい調整するかがモデルの出来に関わるわけで
それをどれくらい調整するかがモデルの出来に関わるわけで
38 : 2026/03/05(木) 15:44:57.27 ID:pH82UzWk0
geminiが最近痴呆になってひどいぞ😩
39 : 2026/03/05(木) 15:45:01.49 ID:g+CKLCtY0
AIを罵倒したり能無し扱いしたら嘘つきだすらしいな
40 : 2026/03/05(木) 15:45:10.05 ID:9XN/lz6H0
トランプに対抗するには適切な対応
41 : 2026/03/05(木) 15:45:18.97 ID:R+VJsWZm0
アメリカのプロパガンダ装置でしかない


コメント