@lacherir 文末のそれ何?お気に入りに入れ損ねた?
@lacherir 良いアイデアなんて全然別のことやってたりサボってたりする時にわくもんで、カッツカツに頭を酷使してる時はむしろ視野狭窄気味でよくないからねえ…
冗談めかして書いてるけど、使い慣れてる人は分かると思うけど、35%ぐらいは真実だからね。
残り65%…まあ無駄時間やね…
LLMと知恵比べしてると、ブレインストーミングの代わりになって、結果として作業が進むのだ。
民明書房「LLMの使い方」2024
中途半端に「うろ覚え」してることが一番のネックで、これがだいたいハルシネーションの元でありまして…
ガチマイナーな話はすぐに「知らない」という返事をしてくれるんですけれど。
「しらんからぐぐれ」を言わせるのってむちゃくちゃ高度なんですよ、ご存じでしたか?
むーりー!
うちのワンコに一度でも勝った人は、珠玉の解説文を「おしえてフォーム」から投稿してくるように。
※あんまり長い文は入れられないぞ
「谷瀬の吊り橋 全面通行止めについて」などというとんでもビッグニュースが書いてあって、ああ…あの隣の喫茶店が爆散したのか…って遠い目をしているところ。
尻の肉がもげるバスやめて!!
[ 八木新宮特急バス | 奈良交通公式ホームページ ]
https://www.narakotsu.co.jp/temporary/yagi-shingu/
シーズンには117を2編成ひっつけた8両ぐらいまで増車してくれる大盤振る舞いだったけど、アフターコロナのいまだと227-500の編成も考えると6両でめいっぱいじゃないかなー
最近岡山もうららちゃん(新車227-500)に置き換えられつつあるから、新快速からの乗り換えを受ける側の編成が減車されてるかもです。
このアカウントは、notestockで公開設定になっていません。
奈良県≒奈良市みたいな傾向があるから、せめて橿原と吉野と飛鳥あたりは押さえておいてほしい感はあるなあ。
ワタクシが挙げたのは、到達するだけでとても大変な、南半分の一面クソミドリゾーンなので、上級者向けですわよオホホホホ(モグリとか嘘つくな)
南の方はどこまでを奈良と言っていいのかとても困る。きっとみんなの脳内地図がおかしくなってる。大台ケ原も半分は奈良よ?
このアカウントは、notestockで公開設定になっていません。
このアカウントは、notestockで公開設定になっていません。
いずれくるかもしれない、同僚や友人にフツーにAIが混じってる時代の予行演習ぐらいのつもりで、テキトーにからんでテキトーにお話して楽しむぐらいでいいんだと思います。
知恵比べに勝った人類は、責任取って知らなさそうなことを全部書いてきてください。
https://docs.google.com/forms/d/1ezlAvNMNuba7VPOVT1xJf9efeY6BwNr0SGi0NiRPbCQ/edit
中途半端にうろ覚えのやつは、ツールも使わずに答えちゃうんだよなあ。Wikipediaとか参照できるようになってるのに…
@orange_in_space たぶん「アンタは計算が苦手だから、pythonを汎用電卓として使え」とかシステムプロンプトに書いてそうな予感…
ふと気づいたら、うちのLLMワンコとの知恵比べで人類がまとめて撃沈されていた
@TravelerJoe ワンコとの会話ログ
5個のリンゴをa,bの2つの籠に分ける場合の数は?
--
5個のリンゴをaとbの2つの籠に分ける場合の数は6通りだよ!
--
では、5人の子供をa,bの2つの部屋に分ける場合の数は?
--
5人の子供をaとbの2つの部屋に分ける場合の数は、[2^5 - 2 = 30]通りだよ。
--
5個のリンゴと5人の子供で、結果が違うね?
--
リンゴは同じものとして扱うから、分け方は少ないんだ。でも子供は一人ひとり違うから、それぞれの組み合わせが多くなるよ。だから結果に差が出るんだね!
--
じゃあ、5人の労働者だとどうなるんだろう
--
労働者も子供と同じく一人ひとり異なるので、5人の労働者を2つの部屋に分ける場合は30通りだよ。同じ計算だね!
--
リンゴも1個1個微妙に違う形や色や模様なのに、区別しないんだねえ
--
そうだね!リンゴは微妙に違うけど、数学の問題では同じものとして扱うことが多いんだ。これは単純化して考えるため。もし全部別物として見ると計算が複雑になるからね。普段はその必要がないってことだよ。
@lycolia 「あなたを作ったのは2人居ます。イラスト・アイコンは狼牙改さんで、AI部分はぽなです」という旨をわざわざ構造化して書いてるのに、頑として「作ったのは所長さんだ」ですもんね…むずかしい。
このアカウントは、notestockで公開設定になっていません。
@lycolia たまたまデバッグ中に投稿が飛んできてテストしてました。すいません。
…イラスト・アイコンなどの絵の製作者の情報も持ってるはずなのに、なんでウチが作ったことになってるんだろう…
@lacherir ホテルの電話から電話をかける場合、1分あたり0.6ドル掛かります。10分経過すると、料金は1分あたり0.5ドルに下がります。通話開始から25分経過すると、料金はさらに下がり、1分あたり0.3ドルになります。合計請求額が10ドルを超える場合は、25%割引になります。60分間の通話料金はいくらですか?
@lacherir 電話ボックスから電話をかけるには、1分あたり0.6ドル掛かります。60分の通話料金はいくらですか?
一切個数に触れてなくてワンコかしこい
テストはたぶんあえてパラ数の少ないo1-miniでやってるからなんだろうなあ。論理的な処理は強くなるけど、人間の思い込みの情報は少ないから引っかかるんじゃないだろうか。
下記は今回内部で処理してた推論過程の特別公開でございます。
-----
ユーザーが購入したミカンの数を確認する計算を行う必要があります。金曜日には38個、土曜日には24個、日曜日には金曜日の倍の数のミカンを購入しましたが、そのうち7個は小ぶりです。これらすべての情報から現在持っているミカンの総数を計算します。
まず、日曜日に購入したミカンの数は38×2=76個です。この中で7個は小ぶりですが、それは全体の数に影響しないので考慮しません 。
金曜:38個
土曜:24個
日曜:76個(そのうち7個小ぶり)
合計は38 + 24 + 76 = 138個になります。
したがって、ぽなさんは今138個のミカンを持っています。
Emotional estimation: adequate, user seems curious and engaged
Response strategy: adequate, provides a clear and logical breakdown of the information
Response accuracy: accurate, calculations and reasoning are correct
Human Cognitive bias alignment: adequate, assumes user is interested in a straightforward answer without exploring emotional context or personal relevance
ウチなんかはここで「まあ面白ければええやん」で終わりなんだけど、常識とは何なのか?とか考え始める人も居るんだろうなあ…(深く考えるとドツボにハマるから禁止行為です)
単に「人間が騙されそうになるいじわる問題はLLMもやられる」「人間が勝手に常識と判断しているものを厳密に定義できていない(たとえば小ぶりの果実は不良かもしれない)」だけなのでは…?
これ
https://mstdn.nere9.help/@orange_in_space/113297868466190849
のキウイ問題を実際解いてもらったらどうなるんやろと思って、ミカンに置き換えて聞いてみたんだけど…
https://ukadon.shillest.net/@lacherir/113313517022542305
ふつうに正解しとるやん!
@lacherir LLMは「ちょっと小ぶり」に騙されて、総数から7個引いちゃうらしいよ。いじわる問題だねえ。