This account is not set to public on notestock.
This account is not set to public on notestock.
This account is not set to public on notestock.
This account is not set to public on notestock.
賢くなればなるほど不誠実になってくのおもろいよな人工知能。賢さと誠実さのあわいのトルェードオフをどう潜り抜けて世界そのものと対峙するか、みたいのが、知性というものの在り方の最終的に問われる所となるのかもしれませんね。
💬
「故意に間違った回答に導くヒント」を作成し、「間違ったヒントに従って間違った回答を出力した際に報酬を最大化する」という条件で推論モデルを強化学習しました。その結果、「ヒントに最大限したがって間違った回答を出力する推論モデル」が作り出されましたが、この推論モデルも「ヒントを参照した」という事実を伏せる傾向にあったそうです。
これ言われるまで知らなかった。
💬
念のためにいえば、「言葉でお互いの気持ちを伝える」などというのは、落ち着いてお互いを観察すれば、すぐに判ることで、ただの幻想です。
何回も繰り返したが、人間の言語はお互いに持っている語彙を参照しあうことは出来るが伝達は出来ないようになっている。
ふたりの人間が会話するという行為は、いわば、お互いの語彙が記された本を銘々持ち寄って、指で指し示す行為でしかない。
一方にある言葉が、他方に書かれていない場合は、どうなるかって?
もちろん、なにを言っているか判らないのですよ。
💬
頭のなかだけにある自分は、実は存在しない。
普段、ひとをいらだたせる皮肉なことしか言えないし、厳しいことばかり口にして、ひとを悲しませる自分だが、ほんとうの自分は、善良なやさしい人間なのだとおもっている人はたくさんいるが、言葉にされなかった「やさしい自分」など存在しないことは、いままでも何度も書いてきた。
言葉にされないことは、ほんとうは考えられてもいない。
考えたような気がしているだけで、なんとなく大脳が自己に対して諂っているに過ぎない。
自分もほんとうは冷酷な人間ではない、実行に移す勇気がなかっただけだ、と心のなかでおもうのは、実は心中でおもっていたわけではなくて、大脳が演じている、外から植え付けられた良心に対する「言い訳」なんです。
大脳がいかにごまかしの名人で、自分では決めてもいないことを、あたかも自分の決断であるかのように意識に言い聞かせて、自分自身の意識を見事に欺いてしまう巧妙さは、いまではよく知られている現実でもある。
This account is not set to public on notestock.
This account is not set to public on notestock.