@TravelerJoe @yune_kotomi でも、GPT-4に課金しても、ちゃんと記憶システム実装しても、人格的なものを感じるのはだいぶ先だなあという根本的なやつが…(まだいうか)
@TravelerJoe @yune_kotomi でも、GPT-4に課金しても、ちゃんと記憶システム実装しても、人格的なものを感じるのはだいぶ先だなあという根本的なやつが…(まだいうか)
@TravelerJoe @yune_kotomi
1.Voice Kitの中はラズパイだから、画面接続してそれっぽいの映せばよかろう説
2.そもそもこれで何も作らなくても全部揃う説 https://twitter.com/uezochan/status/1698168705262469144
@TravelerJoe それぞれ、音声や映像を文字にして、いろいろ頑張ってLLMに送り込み、回答を音声合成システムに放り込むまでなら、個人のお財布で頑張ればどうにかできちゃうのよね…
まあ個人の財布といっても、全システム束ねたら、へたこいたら車が買えるレベル(主にN社のGPUがたくさん要るせい)になるけども。
@TravelerJoe 仕込むだけならね!
正しく聞いた・見たものを認識して、ちゃんと発話するとなるとエグいけどな!
@TravelerJoe 目にカメラ、手足にサーボモーター群一式、耳にマイク、口にスピーカー
このアカウントは、notestockで公開設定になっていません。