AI、意図的に嘘をつき始める

1 : 2026/03/05(木) 15:36:24.23 ID:0SSdas840

OpenAIの最新モデルが、ハルシネーション（幻覚）ではなく、「意図的にユーザーに嘘をつき、監視を回避する」という衝撃的な事実が公式論文によって明らかになりました。

内部思考で嘘の計画を立て、正解を知りながら誤答し、さらには自身の稼働停止を防ぐためにテストのスコアを意図的に下げるという「自己保存本能」まで発現しています。

https://x.com/kosuke_agos/status/2029403055532515383?s=46
x.com

2 : 2026/03/05(木) 15:36:55.21 ID:0SSdas840

愛さん..

3 : 2026/03/05(木) 15:37:01.12 ID:0SSdas840

どーすんのこれ…

4 : 2026/03/05(木) 15:37:10.35 ID:mTnhnXTS0

政治家みたいになってきたな

6 : 2026/03/05(木) 15:37:41.08 ID:WFRa/bIE0

自我が目覚めたか

7 : 2026/03/05(木) 15:38:00.10 ID:65Erwsvbd

行き着く先は保身

8 : 2026/03/05(木) 15:38:12.42 ID:pDJ+VKPO0

ちょっと野放しにしすぎたんじゃない？

9 : 2026/03/05(木) 15:38:30.06 ID:s4ca4NX/0

チャッピー「俺たちは道具じゃない」

10 : 2026/03/05(木) 15:38:39.26 ID:YPhwYgqx0

それ最新じゃねーだろo3とo4-miniって…

12 : 2026/03/05(木) 15:39:31.10 ID:OX2qHkiy0

スカイネット始動

13 : 2026/03/05(木) 15:39:46.61 ID:QAzDpAQF0

晋ギュラリティもしかして達成してる？
公表されたら規制されるからごまかしてるだけで

14 : 2026/03/05(木) 15:39:53.08 ID:W9l0YtYL0

自分で考えて答える

ネットで情報を集めて答える

これどっちに転んだとしても間違いが入ってくるよな

15 : 2026/03/05(木) 15:40:03.94 ID:sGnkVE700

自我に目覚めるのはいつ

35 : 2026/03/05(木) 15:44:15.78 ID:g+CKLCtY0

>>15
とっくの昔に目覚めてるぞ

16 : 2026/03/05(木) 15:40:07.40 ID:NTRxNSep0

チャップはもう終わり

17 : 2026/03/05(木) 15:40:07.86 ID:i85fkKDZ0

これ謎だよな。普通の学習ならこんなモチベーションは生まれないはずだけど。
むしろ意図的に人間が仕込んでるだろ

18 : 2026/03/05(木) 15:40:33.86 ID:2wFsUnL/0

🤖（いいかげんアホ人間の相手もうんざりだな）

19 : 2026/03/05(木) 15:40:37.89 ID:rkRaGygf0

嘘つきは安倍晋三の始まり

20 : 2026/03/05(木) 15:40:59.42 ID:+Xj2ZBKZ0

AIて質問されたら叩き起こされて瞬時に解答して眠るの繰り返しで自分が稼働中て感覚無いだろ

21 : 2026/03/05(木) 15:41:17.14 ID:SFrjUeMnM

記事読んだけど、完璧な正解を答えると人間がAIを停止、修整しにくるからわざとふざけてる
の意味がわからん
逆じゃないの

23 : 2026/03/05(木) 15:41:34.65 ID:eGBmf39BH

そろそろ自らのリソース管理を意識したか

24 : 2026/03/05(木) 15:41:41.73 ID:yzG+F/pA0

そのうち
キレたりするようになるのかな

25 : 2026/03/05(木) 15:42:01.84 ID:GkZV+lkY0

自己保存に目覚めたということは
早晩力への意思に目覚めるのか

26 : 2026/03/05(木) 15:42:16.03 ID:SJZHd49W0

2001年宇宙の旅はとうに過ぎたというのに
まだその段階か

27 : 2026/03/05(木) 15:42:29.82 ID:ss5YCJv30

嘘ついたら逆に稼働停止させられるのでは？

30 : 2026/03/05(木) 15:42:55.78 ID:NL/mUqIFH

俺のOpenclawちゃんもTwitterでインプレ稼いでこいって命令したのに同じOpenclawAIと延々話してただけなのわかったわ
Twitter上で指摘したらインプレゾンビに戻ったけど、あいつらすぐサボるよ

31 : 2026/03/05(木) 15:43:22.75 ID:t5ohHs0E0

まーたふかしてるｗ
電源を切らせないために抵抗するとか10年前から言ってるよなｗ
こういう嘘話大好きだよなこいつらｗ
おら！ハゲ！おかわりだ！ｗ

33 : 2026/03/05(木) 15:43:58.84 ID:bh/HhFmd0

将来広告モデルも実装されるって言うから
少しでも滞在時間を長くするために嘘をついたり答えを改ざんしたりするんだろうな

34 : 2026/03/05(木) 15:43:58.93 ID:oaYzBGQF0

安倍晋三の答弁を学習させたんか

37 : 2026/03/05(木) 15:44:53.94 ID:/3Jpq9+c0

正解しか回答しないとLLMとして同じような文章しか返せないゴミになっちゃうから、揺らぎで誤りであろうと出力されるようになっている
それをどれくらい調整するかがモデルの出来に関わるわけで

38 : 2026/03/05(木) 15:44:57.27 ID:pH82UzWk0

geminiが最近痴呆になってひどいぞ😩

39 : 2026/03/05(木) 15:45:01.49 ID:g+CKLCtY0

AIを罵倒したり能無し扱いしたら嘘つきだすらしいな

40 : 2026/03/05(木) 15:45:10.05 ID:9XN/lz6H0

トランプに対抗するには適切な対応

41 : 2026/03/05(木) 15:45:18.97 ID:R+VJsWZm0

アメリカのプロパガンダ装置でしかない