2024-05-29 09:01:34 takimura@​:misskey:​.dev​​:spi:の投稿 cv_k@misskey.dev
Googleのサーチアルゴリズムが漏洩。大事件だ、ますます検索環境が悪化してしまう可能性が出てきたではないか :angry_ai:
icon

Googleのサーチアルゴリズムが漏洩。

さすがにこの規模のリークは歴史上、初めてのことだと記憶しています。

そして、Google自身は否定していたもののSEO業界では長年疑われていたアルゴリズムの数々が実在していたことも明らかになりました。

2,596個のモジュール、計14,014個のランキング特徴量。

以下、主なものを解説していきます。

1. ドメイン権威

Googleの公式見解は「我々はドメイン権威のようなものは持っていない」というものだったが、siteAuthorityというfeatureの存在が確認された。

2. クリック

これもGoogleの公式見解と異なり、GlueやNavBoostというランキングシステムにより、クリック情報が検索ランクに影響を与えていることが明らかになった。NavBoostは2005年から存在していて、過去18ヶ月のクリックデータを元にしている。

3. ホスト年齢

hostAgeというフィーチャーの存在によって、生まれたばかりの新しいサイトはやはりサンドボックスに閉じ込められていることが明らかに。hostAgeという言葉自体がhost + ageの合成語だけでなく、一単語で「人質・担保」という意味を持つので言葉遊びですね。

4. Chromeのデータ

Chromeの利用データはサーチに影響しないという公式見解をよそに、やはりChromeのデータは使われていた。使わないわけがないので否定すること自体が公式見解の信憑性を損ねていたと思います。

5. アーキテクチャ

Googleのランキングシステムは単体の巨大なアルゴリズムではなくマイクロサービスの集合体。Trawler (クロール) / Alexandria (インデックス) / Mustang (ランキング) / SuperRoot (クエリー処理) などからなる。

6. リランカー

これに加えて、NavBoost / QualityBoost / RealTimeBoostなどのブースターでSERPの一等地に何を表示させるかを競い合わせている。中でもNavBoostは出現率が高く強力な様子。

7. Pandaアルゴリズム

Amit SinghalがリードしたPandaは、ユーザー行動や外部リンクなどに基づいてランクのスコアを調整する。特許にもなっている。ドメイン、サブドメイン、パスなどの多レベルで適用される。オブザーバビリティを担保するため、あえて機械学習を使ってないという点が印象的。

8. author属性

Google公式のE-E-A-T推奨通り、author属性は特徴量になっていた。ほとんどのサイトやフィードでauthor系メタデータはちゃんと入力されていないケースが多いが、これは対応したほうが良いかもしれない。

9. 降格

リンク先のコンテンツとのミスマッチ、SERPにおけるユーザー行動、UXの不備、検索ワードとドメイン名が完全一致する場合、製品レビュー系コンテンツ、グローバルページ、ポルノ、などは降格される。

10. リンクグラフはまだまだ重要

sourceTypeなどのメトリックによりリンクの重みが変わる。インデックス・ティアに分けられ、重要度高・更新頻度高・アクセス頻度高のコンテンツはより高速なフラッシュメモリに保存され、ティアの低いインデックスはハードディスクに保存される。

11. リンクスパムはベロシティ・シグナル重視

スパムは短期間に大量投下されたもののスパイクを検出することを特に重視している。怪しいものを見つけたら現在のベースラインと比較して異常値を検出。

12. 最新20件のページ更新履歴を保持

インデックスされたページの評価が高まってから変更して別のコンテンツに誘導するなどのハックを防ぐために過去20件の変更履歴を保持していることが判明。逆にいうと最大20件とバレてしまったので狙われそう…

13. ショートコンテンツの独創性を評価

Twitterのようなショートコンテンツでは、OriginalContentScoreにより、文字数をカウントし、オリジナリティを評価。

14. 日付は重要

鮮度は重要。bylineDate / syntacticDate / semanticDateなどにより、コンテンツの正確な日時情報を様々な角度から抽出している。

15. ビデオサイトは別扱い

もし50%以上のページがビデオならビデオサイトとして扱う

16. Your Money Your Life (YMYL) も特別扱い

公式情報通り、お金や健康など人生にクリティカルな影響を与える情報はより厳格に扱われる。

:twitter: https://twitter.misskey.dev/status/1795500175487832491

2024-05-22 06:54:23 GNOME Appsの投稿 gnomeapps@mastodon.mossy.page
icon

このアカウントは、notestockで公開設定になっていません。

2024-05-20 09:10:46 雪あすか🔞の投稿 askyq@kmy.blue
icon

このアカウントは、notestockで公開設定になっていません。

2024-05-18 13:42:20 たけうちひろあき :zonepane:の投稿 takke@fedibird.com
icon

このアカウントは、notestockで公開設定になっていません。

2024-05-18 11:29:47 のえるの投稿 noellabo@fedibird.com
icon

Fedibirdには『自分限定』っていう公開範囲があって、内部ではpersonalって呼んでるんですけど、これを使うと本当に自分のためだけにMastodonを使えます。

単に、思考の断片を書き留めておく、日記にする、というだけでなく、

メンションや返信・引用・参照が含まれていても自分以外には存在が認識されないので、何か関心のあるものをタイムラインで見かけた時に、それに言及して残しておくこともできます。

Fedibirdは全文検索が強く、いろんな条件を指定できるので、あとから必要なものを探し出すことも容易にできます。例えば、

is:personal is:reply 絵文字

と指定することで、『絵文字』っていう言葉を使った投稿で、自分限定で、誰かの投稿に返信としてぶら下げたものだけ、という条件指定ができます。

こういう機能が欲しい人は限られているかと思いますが、気に入る人にはかなり刺さるやつです。惜しむらくは、どんなにこうした用途でFedibirdが活用されていても、誰にも気付かれないということです……。

2024-05-14 11:00:54 のえるの投稿 noellabo@fedibird.com
icon

それと、こちらはboobee.blueを運営しているKingYoSunさんの、このインタービューをうけて書かれた記事です。

boobee.blueは、Mastodonをそれぞれが好きなように立ててるのと同じように、公式とは別に立てられた独自Blueskyサーバね。その先駆け。

関心があったら、これもあわせて読んでおくといいと思うよ。

ジャック・ドーシーがBlueskyを辞めた理由をもうちょい詳しくエスパーする
note.com/kingyosun/n/n2cdc6ea4

Web site image
ジャック・ドーシーがBlueskyを辞めた理由をもうちょい詳しくエスパーする|KingYoSun
2024-05-07 17:51:20 Renaud Chaputの投稿 renchap@oisaur.com
icon

このアカウントは、notestockで公開設定になっていません。

2024-05-05 10:14:23 フジイユウジの投稿 fujii_yuji@mstdn.fujii-yuji.net
icon

このアカウントは、notestockで公開設定になっていません。

2024-05-03 15:22:59 らりお・ザ・何らかの🈗然㊌ソムリエの投稿 lo48576@mastodon.cardina1.red
icon

`[` コマンドは test コマンドの最後の引数に `]` を要求するバージョンです

2024-05-03 15:27:54 シャポコ.io🌵の投稿 shapoco@misskey.io
icon

このアカウントは、notestockで公開設定になっていません。