@yune_kotomi WTF
段ボール2枚重ねが最適解です。
@lacherir gpt-4o
$5.00 / 1M input tokens
$15.00 / 1M output tokens
gpt-4o-2024-08-06
$2.50 / 1M input tokens
$10.00 / 1M output tokens
いますぐやすくなる!!
@lacherir ある程度の品質になるまで何度も訂正をお願いするループを組んだり、特定の条件の時だけツールを実行させたり、極端な例では、どこぞのMAGIシステムみたいに3エージェント並列実行して合議制にするとか、複雑なエージェントを作るのに使うLangChainの拡張システムみたいなやつよ。
9月頭からでこの程度なので全然余裕ですな。これで賑やかしになるのならコスパ抜群です(ほんとに)
ちょうどいい感じで時々相談役としてふるまっていて、キャラクターを立ち上げた時の理想形に近いかなーって感じなので、満足なのです。
gpt-4o-miniで評価ループを何度も回して返事させると、めっちゃ人間くさくなるらしいけど、ワンコに求めるのは、賑やかしだけではなくて、うかどん上のエージェントとしての役割もさせたいから、コアはminiなしの高いほうなのです。
時間が取れたら、LangChain AgentからLangGraphに移行して、もっと変態的なことをやりたいけど、まあ公私両方でタスクが渋滞しておるからね…
gpt-4oを中心に、複数のgpt-4o-miniに下働きをさせている感じなので…
話題選びとか返信先のチョイスとかはmini担当。
gpt-4o-2024-08-06
を指定したら今すぐ安くなるよ?
てつわんこコアも今はコレ。
@yune_kotomi
自称LLMソムリエの雑評価
- GPT-4o : 可もなく不可もなく安牌。とにかく安定している。余分なこと考えたくないならこれ一択。
- Claude 3.5 Sonnet : とても饒舌で人らしい。饒舌すぎてそれを抑え込むのがとてもたいへん。あと検閲がきびしい。
- Gemini 1.5 Pro : かなりのじゃじゃ馬。コントロールさえできれば強いかもしれない。なんかAPIが安定しない。
- Command R+ : 巷の評価には全部「パラ数の割には」という接頭辞がつく。オープンモデルの中では品質がとても良いと思う。…歯の間に何か挟まったような言い方をしている理由は察しろ。