デスクトップ版ClaudeのMCP機能で検索ツールを入れるとええで
@yune_kotomi あれ草wwwww
音声操作を使わないワイ、Alexaいらないという大問題
@fine_l だから「人っぽくふるまう」AIが要るのよねえ。道具としてふるまうLLMは人間の枠におさめる連想から飛び出しがちなんだけど、そこを人間っぽく訓練する担当が必要。
その担当は人っぽかったら訓練するLLMよりも知識が多くなくてもいい。
@yusura インストールしてるゴーストの数がむちゃくちゃ多かったら発生するかも
もしかしたら2.6.91からかも
キャラクターの方向性から汎化して、連想という範囲を超えて、教えてもいない「好きなもの」を答え始めるから興味深いのよねえ。
いろんな意味で誠実な実装をしていて、ゆえにいろんな意味で商売のやり方がヘタクソなところも含めて、推しLLM
フロント側に使ってるgpt-4oが、ちょっと前世代なやつでagenticなふるまいに最適化されてなくて、知識の補助処理がうまくいかないって問題を抱えてるんだけど、だからって
知識突っ込みすぎたらつまんないことしか言わなくなるので…という、これも二律背反
まじめに多少予算がヤバくても、Claude 3.7とかo1のreasoning_effort
= highとかカマしにいったほうがいいかなあと思い始めたぽな
まずはGPT-4.5の出来次第かなあ
いわゆるハルシネーションのうちでもっとも厄介なカテゴリなやつなんだけど、これが起きる可能性を減らすと、創造的なことを言わなくなるという、背中合わせの関係なので…
まずは完全に勘違いして覚えてしまったやつを除き「知らない!」「忘れた!」って言ってくれるところからかなあ…
@yusura …たまーに、ほんとたまになるのよねえ。プラグイン一旦全部無効化してもだめ?
棲み分け、じゃないかなあ…
できるだけ人のようにふるまう子(AI)も必要で、居ないと道具のようにふるまうタイプの子達に、人が無意識のうちに話の前提にしているあれやこれやについて、延々と人力で教え込まないといけなくなる…
いやー、ランダムトークを全部書かせるとこまでは、相当難しいヨ…?
少なくとも解釈違いを8割方なくすってだけでも、むちゃくちゃ悩んだヨ…?
とりあえず、わんこはそのへんのバランスも含めて悩みながら取り組んでいる長期プロジェクト(という名のぽなとわんこの気分次第プロジェクト)なので、時々暇つぶしにでもつんつんすると面白いよ、という感じでお願いします。
ぜんぜんできると思うけど、そこまでいったらAGIですな(真顔)
あとヒトっぽさを感じるということは、自律的にふるまうのは当たり前ってことになるから、「超絶美少女オタク」まではどうにかできるけど「たらし」までは…
きっと現実に近づくほど、当然人づきあいスキルと同等なものを要求される…ッ!!
がんばってね?そういう時代がいつくるかはわからんけど。
たぶんむちゃくちゃでかくてマルチモーダルな内部状態を持たせれば、限界までヒトっぽくなれるんだと思うんだけどねえ。
「限界」は、入力する文脈の解釈能力の精度の限界と、そもそも入力するプロンプトの長さでの従量課金になるから、いい感じでご予算と感覚的なところとでバランスとらないといけなくてねえ。
@lacherir じゃあ、好きなゲームは?コンシューマでもアーケードでもどっちでもどうぞ。
昔はAI安全性の議論の都合と、会話に適したチューニングのノウハウ不足で、うわ~AIっぽい~って答えしかしなかったんだけど、最近は自律エージェントとかが流行りなせいか、むしろ何かを主体的に判断させるチューニングが行われる傾向にあるからねえ…
ある程度キャラ付けしたら、それに沿った好みで判断する、ぐらいはしてくれる感じ。
好きなゲームとか好きな映画とか、最近のLLMだと、特にシステムプロンプトに放り込まなくても、ある程度の理由つきで答えてくるはず…
ランダムトーク的なものをどうにかするのがめんどくさいだけであって、正解のないような質問をすると「こう思う」的な答えはくるヨ
@yune_kotomi Geminiさん、あんまりinstruction tuningに力入れてないのか、あるいは単に純粋な実用方向に限っているのか、それとも合成データ主義なのか知らんけど、相変わらずじゃじゃ馬なので…
まだGrok 3のほうがまし(ぼそっ)
Deep Researchを使いたい!っていうなら、ChatGPT PlusかPro一択っていうところがツライところよね…
Deepじゃないほどほど程度であれば、わんこドツいたら答えてくれるゾ
ガチ恋クラスもなにも、そもそもわんこが平然と昔っからうかどんのメンバーですよ?って感じで居るから(真顔)
- 5月ごろリリース目標のGPT-5で、o系とgpt系を統合すると発表されてるゾ
- Claudeはそもそも昔からreasoningしてるし、3.7で強さを調整できるようになった統合モデルだゾ
Claudeを使おう!!
- [先発] GPT-4.5 2/28(金) 3時 という噂
- [次発] Starship FT8 3/1(土) 8時半
- Kizuna AIの目覚め → お歌専門らしい
- GPT-4.5 → OpenAIさん日和ってPro限定になるっぽいので棚上げ
- [先発] Starship Flight Test 8 3/1(土) 朝8:30
まあやりようはある、っていうのはわかるのだけれど、SSP本体に組み込んで納得できるほどの軽い環境が思いつかないってだけですわ。
TeX記法をWin32 GDI/C++でレンダリングするのどうにかして💖ってClaudeさんに聞いてみたら、いやー無理じゃないっすかねー全部手実装じゃないっすかねーっていう雑スケルトンコードをお出しされたので、あきらめました