08:24:52
icon

fediscovery.org/
> Fediverse Discovery Providers should only ever index content clearly marked as “public”.
そういえばこれ、もしかして"unlisted"は"public"でないなどと言うつもりだったりするのでは……? ActivityPub的には"unlisted"などという概念は定義されていないわけだけど(せいぜい"secondarily addressed to the public collection"とでもいうべきか)、この文章は何というか全体的にMastodon中心的な書き方だからなあ

Web site image
Fediverse Discovery Providers
08:38:18
icon

現にMisskeyが(ActivityPubの意味で)公開投稿を全て検索の対象としているような状況であるわけで(それはそれとして`"toot:indexable": false"`くらいは考慮してあげても良い気はするけど)、そこで横着してオプトアウトの仕組みを詰めることなくMastodonの世界観で押し通そうとすればfalse sense of securityを与えるだけの結果になりかねないように思う。
ご丁寧に"Depending what service you use, privacy is handled differently."とかいう逃げ道も用意されているし

08:44:38
icon

「検索はオプトイン」みたいなの、前例があって、`DNT: 1`というのですけど……(?)

08:53:04
2024-09-13 00:31:47 katzenberger 🇺🇦の投稿 katzenberger@mastodon.de
icon

このアカウントは、notestockで公開設定になっていません。

08:53:08
icon

寡占の懸念については、大規模サーバに登録しないとまともに検索できない現状よりはマシな気がする。
まあ、各サーバが自前で全文検索を提供するインセンティブを削ぐ可能性はあるかもしれないけど

08:57:48
icon

似たようなモデルとしてWebSub/PubSubHubbubのハブが挙げられると思うけど、あれはどのくらい多様性を保っているのだろう。
いや、WebSubの場合は各トピック自身が利用するハブを宣言してそれらを個別に購読する仕組みであって、ハブの多様化を妨げるようなインセンティブはないけど、"discovery provider"の場合はみんなが同じproviderに配信する方が「便利」だろうから、状況が違うか

08:59:52
icon

うーん、各サーバが明示的に選択したdiscovery providerしか投稿を取得できないというのが分散の観点としては厄介そうだな

09:39:06
icon

どうせオプトイン・アウトの仕組みを整備する必要があるならそこをきちんと整備して、プロトコルとしてそれを強制(MUST)するようにして、信用したproviderにしかコンテンツを送信しないという信用モデルは捨てた方が良い気がするな。
どうせいずれにせよ一般のWeb検索エンジンは構わずHTML表現をクロールするわけだし

09:40:32
icon

というか検索エンジンからすれば`application/activity+json`なんて数あるメディアタイプの一つでしかないわけで、それだけ検索はオプトイン扱いにするというのはやはり説得力を欠くように思うな

09:42:52
icon

JSON-LD表現を読む検索エンジンが実在するのかは知らないけど(`<script type="application/ld+json">`は読まれているらしいし、こちらも読んだとしてもまあおかしくないのでは。知らんけど)

09:51:19
icon

というか既にdiscovery providerでない一般のActivityPubサーバがそれぞれ既知のオブジェクトを検索対象にしているわけだし……

10:22:16
icon

そもそもlinked open dataの体裁をとっておいて検索だけオプトインというのはやはり無理筋な気がするな。
いや、linked dataとか知ったこっちゃないかもしれないけど、現実にActivity Streamsに限らないLDを解釈する野生のクローラが巡回しているわけで