icon

@seri4kb @diraid_c 技術的に難しいので、一旦とりやめることになりました。いま一時的に実装されているサーバからもそろそろ消えます。

icon

@kamisuke おはよう、王

icon

ログボ

icon

@nibushibu inは、今回の新しい検索範囲全部を対象とするか、従来通り自分の投稿+リアクション分だけを対象とするか、切り替える機能です。

2023-10-07 09:02:42 画眩の投稿 ggagen@pawoo.net
icon

このアカウントは、notestockで公開設定になっていません。

2023-10-07 09:02:44 画眩の投稿 ggagen@pawoo.net
icon

このアカウントは、notestockで公開設定になっていません。

icon

@ciqi スマートフォンでの操作だとやりづらいかもしれませんが、エンターの代わりにスペースを入力するのはいけるかな?

icon

ウチのElasticsearch、たしか80GB超えだったはず……。

icon

@renpihanemui このへん [参照]

Web site image
投稿の参照(1件) by のえる (@noellabo@fedibird.com)
icon

ケツイ

icon

検索TIPSの続きを流すよー

icon

■ ハッシュタグ検索 #

例) 新機能

Mastodonの全文検索で、特定のハッシュタグを含む投稿に絞り込みたいときの指定です。

先頭が # で始まる語句をハッシュタグとして検索します。

通常の本文検索でもハッシュタグの一部にマッチしますが、ハッシュタグとして検索すると、

一致するものだけマッチすること、本文に含まれないハッシュタグ(※)も対象となります。

※ 本文の中には語句が含まれないが、見えないハッシュタグがついている投稿もあります。

icon

■ 言語指定検索 language:

例) language:en

Mastodonの全文検索で、特定の言語による投稿だけを対象にする指定です。

ja 日本語
en 英語
fr フランス語
zh 中国語
ko 韓国語

などを指定します。

投稿時に言語指定できる最近のMastodon以外の投稿では、推定により間違った言語が指定されている場合や、言語が何も指定されていないケースがあるのでご注意ください。

icon

■ 属性指定検索 has: is:

例) has:image

Mastodonの全文検索で、投稿の属性によって絞り込みたいときの指定です。

image 画像
video 動画
audio 音声
media 添付ファイル
poll 投票
link プレビューカード付き(OGP等)
embed 埋め込みあり(YouTubeなど)
sensitive CWテキスト付き
reply 返信

hasとisはどちらを使っても結果は同じです。英語で意味が自然になる方を使うと良いでしょう。

除外指定(先頭に - をつける)を組み合わせて、かなり柔軟で強力な検索ができるようになっています。

icon

■ 検索範囲 in:

例) in:library

Mastodon v4.2 から、全文検索の対象に、公開検索を許可したユーザーの投稿が含まれるようになりました。

検索結果が充実して便利な反面、不快な投稿、不要な投稿、検索に紛れ込もうとする過剰な宣伝・スパムなど、ノイズも多くなります。

そこで、これまで同様、自分の投稿とリアクションしたものだけを対象にできるよう、対象範囲を選択するための指定です。

all すべての検索可能な投稿
library 自分のの投稿+リアクションした投稿

icon

■ 本文検索の対象

Mastodonの全文検索において、本文検索の対象となるテキストは、

・CW(警告文)
・本文から装飾を除いたプレーンテキスト
・アンケートの項目
・添付ファイルの説明文

です。

ハッシュタグの文字列も対象になりますが、隠れたハッシュタグはテキストに含まれないため対象になりません。

icon

■ 日本語の検索

例) 京都

分かち書きする言語、例えば英語では、文字を並べて単語を構成し、その単語と単語の間にスペースや改行が入るため、区切りがはっきりしています。

分かち書きしない言語、例えば日本語では、単語を空白などで区切らずそのまま並べて表現するので、単語を区切るために解析が必要です。(形態素解析)

単語を適切に区切って取り出すことで、期待する単語にマッチさせ、無関係な単語にマッチさせない、精度の高い検索が可能となります。

適切に分割されていない場合、『京都』の検索で『東京都』もマッチしてしまいます。

この形態素解析には、検索機能を提供するElasticsearchへ形態素解析を行う追加機能をインストールし、インデックスを作成しておく必要があります。

Mastodonの標準インストールではこれは行われないので、サーバ管理者がカスタマイズしている可能性の高い日本向けのMastodonサーバで検索するのがお勧めです。精度の高い検索結果が得られます。

なお、特定の文字列をマッチさせたい場合は、フレーズ検索と除外指定が便利です。

フレーズ検索
fedibird.com/@noellabo/1111700

除外指定
fedibird.com/@noellabo/1111736

[参照]

Web site image
のえる (@noellabo@fedibird.com)
Web site image
のえる (@noellabo@fedibird.com)
Web site image
投稿の参照(2件) by のえる (@noellabo@fedibird.com)
icon

■ 全文検索対応サーバ

例)
mastodon.social
mastodon-japan.net
fedibird.com

全文検索はオプション機能で、全てのMastodonサーバが全文検索機能を備えているわけではありません。

Mastodonサーバの他に、別途、全文検索機能を提供するElasticsearchというサーバを設置する必要があるためです。

全文検索を利用したい場合、ご利用のサーバが対応しているかご確認ください。

設置の有無は、Elasticsearchサーバの設置・運用の難易度やコストの問題もありますが、サーバ管理者が必要と考えているかの差が大きいように思います。

国内の比較的大きなサーバのうち、現在、mstdn.jp, pawoo.net, best-friends.chatは全文検索に対応していません。

小規模なサーバでは、ホスティングサービスであるHostdonなどが日本語最適化した全文検索オプションを安価に提供しているため、むしろ導入が容易で、対応していることも多いです。

icon

@weepjp のえすきー長生きさせないとねーw

icon

ここまで書いた検索TIPS、Fedibirdの拡張部分は全部省いて説明しているので、またそのうちFedibirdだとこういうことができますっていうのを説明します。

まあとりあえずここに全部かいてあるけど(ブログ)
blog.noellabo.jp/entry/fedibir

Web site image
Mastodon v4.2とFedibirdの検索文字列(早見表)
icon

@weepjp のえろまは、Akkomaだろう問題があってだな……w