22:34:36
icon

5000兆円
欲しい!

も読めるなぁ。

https://news.livedoor.com/article/detail/13386075/ の画像と"この画像を説明してください。"と与えると、

"この画像は、5000兆円を欲しいと書かれた日本語の文を含んでいます。文は金色の文字で書かれ、背景には光る金色の光が散り始めています。この文は、5000兆円という大額な金額を欲求する意図を表しています。"

Web site image
人間の欲望を忠実に表現した「5000兆円欲しい!」がまさかの映像化、ど派手に動いてさらに5000兆円欲しくなる出来栄え - ライブドアニュース
22:06:11
icon

@ekicyou パールのうにゅうですわ

21:49:46
icon

複数画像渡せるから、リファレンス用と判断用の画像を渡して「この2枚のキャラクターは同一キャラクターですか?」みたいなことやればキャラ判定なんかもできる。

21:47:29
icon

ん、Qwen2-VL-7B-Instruct-AWQ動いた。画像がでかくなければ3060でもなんとかいけるね。2Bに落とせばでかくてもいける。

13:04:00
icon

にゃあ