このアカウントは、notestockで公開設定になっていません。
主に、Fediverseへの関心に基づいた投稿を行うアカウントです。DTP・印刷に関する話をしたり、同人の話をしたり、カレーをブーストしたりします。
Mastodonのcollaborator(開発者の一員)です。また、独自機能を盛り込んだFedibirdを管理・開発しています!
Mastodonサーバ『fedibird.com』の管理者アカウントでもあります。ご連絡は当アカウントへ、サーバインフォメーションについては https://fedibird.com/about/more と @info を参照してください。
このアカウントは、notestockで公開設定になっていません。
このアカウントは、notestockで公開設定になっていません。
MastodonからMisskeyアカウントをフォローしていない、避けている理由としてどんなものがありますか?(複数回答)
候補に理由がある場合はその他を選んで返信で追加してください。
フォローする対象をサーバ種別で選んでいないという方、その理由をお聞かせください(複数回答)
理由が候補に無い場合はその他を選んで返信で追加してください。
@kinmokusei 理由ですが、
- Misskeyは投稿に言語指定をつけていないので、言語不明になっている
- Mastodonは投稿者が投稿時に言語指定するか、デフォルト設定が反映されるが、それが日本語になっていないパターン
- 投稿側のサーバで言語の自動判定に失敗して違う言語が設定されている(すごく短かったり漢字中心だと中国語になりやすい/顔文字等にロシア文字が混じってるとロシア語になるなど)
あたりです
@kinmokusei Mastodon側で自動判定させるっていう手もなくはないんですが、誤認することもあるので、現状でも悪くないかなと。
#fedibird #fedibird_info
緩募ですが、全文検索で単語認識されなくて不便なワードありますか?
あったら登録しておこうと思っています。
たとえば「のえる」で検索しようとした際に、単語登録しておかないと「の」「え」「る」に分解されてそれぞれを含む投稿を探してしまうので、まったく意図しない検索結果になります。
そこで、fedibird.comの全文検索エンジンには「のえる」を単語登録してあります。
(※ "のえる" のようにダブルクォートで囲めばそのままの文字列検索も可能です)
また、標準の辞書に「東京都」と「京都」があるので、京都を検索しようとしたときに誤って東京都が出てくることがありません。
@yama35_ これはまた難しい課題だ。
日本語は単語の区切りにスペースをつけないので分解してインデックスするんだけど、アルファベットの並びはそのまま単語として理解して分解しないから、
複数の単語で構成されている語であることを人間側が知っていないと気付かないね。
ちなみに、わかっているなら、
"al jazeera",aljazeera
って書くことで両方の検索結果を同時に出せるね。
これに対応するには、自動的に複数単語に分解して候補に加える機能と辞書が必要だけど、そういう分解機能が要るわ。
ElasticseachではDictionaryCompoundWordTokenFilterで出来そう。