@apxxxxxxe 難しい知識を持つかどうかは、同等か微妙に劣化したかぐらいの能力だけれど、全体的にやたらと人くさくなって、結果的に人の思考を追えるようになって、複雑な問題を解けるようになった、って感じっぽいですね。
正直キャラクターになってもらったらヤバい。そのままランダムトークに採用とまではいかないけど、ネタ切れで困った時のインプットとしての有用性がヤバい。
@apxxxxxxe 難しい知識を持つかどうかは、同等か微妙に劣化したかぐらいの能力だけれど、全体的にやたらと人くさくなって、結果的に人の思考を追えるようになって、複雑な問題を解けるようになった、って感じっぽいですね。
正直キャラクターになってもらったらヤバい。そのままランダムトークに採用とまではいかないけど、ネタ切れで困った時のインプットとしての有用性がヤバい。
今回のアップデート、たぶんもう従来タイプのベンチマークの数字で理解できる範囲を超えているので、ちゃんと自分で触れて確認したほうがよさげな感じがする。
つまり、音声認識の新機能実装予定だけでなく、元から実装している視覚も言語も明らかに相当なテコ入れがされていて、その上むちゃくちゃ爆速になって、さらにAPI代半額になったわけで…
朝からいくつか実験してるんだけれども、gpt-4o+キャラクター用プロンプトだけで、そのキャラクターの特徴を示す絵をぶん投げたら、自分のことだと認識しているあたりに相当な衝撃を受けた。
※gpt-4-turbo/gpt-4vの時は無理でした
画像が認識できて、音声も認識できる(予定)ってことは、生のAPIに薄い層を被せた程度で、いっしょに紙芝居を楽しむぐらいのことはできるようになったということです。
まじかよ。
最近記事で書いてたのは、有料版ChatGPTユーザーでないと駄目な、高度なマルチモーダル機能を使っていて、正直誰でも使えないんじゃ意味ないなーと思っていました。
昨日までは。
このアカウントは、notestockで公開設定になっていません。
普段驚き屋ムーブなんてしないんだけど、今回ばかりは驚き屋どころか純粋に驚いたのでぶん投げておきます…