21:05:22 @cv_k@misskey.dev
icon

赤い帽子被った人が喜んでそうな試合になっとるにゃ

Attach image
21:03:13 @cv_k@misskey.dev
2024-03-30 14:32:12 takimura@​:misskey:​.dev​​:spi:の投稿 cv_k@misskey.dev
icon

.

Attach image
20:49:16 @cv_k@misskey.dev
icon

親迎えに駅に来たのだけどにゃんか警察が駅に入っていった。なんだ事件か…?

18:03:05 @cv_k@misskey.dev
icon

小林製薬「紅麹」問題 大阪市が対策本部会議 回収見込みがある83%の商品回収の完了を報告 大阪工場の6か所でプベルル酸生成の青カビ検出
https://nordot.app/1168391972094935469?c=559314306504344673

Web site image
【速報】小林製薬「紅麹」問題 大阪市が対策本部会議 回収見込みがある83%の商品回収の完了を報告 大阪工場の6か所でプベルル酸生成の青カビ検出 | 読売テレビニュース
16:32:08 @cv_k@misskey.dev
icon

Xperiaのソフトウェア的なオリジナリティがどんどん失われてから必要な機能さえ揃っていればもうどこのメーカーでもいいやみたいになってるんだよにゃ

16:30:42 @cv_k@misskey.dev
icon

フルワイヤレスイヤホンみたいにゃのが市民権を得てしまった現在としてはXperiaのオーディオ性能上げても使われない(もちろんマニアはまだ有線にこだわっている人もいるけどそれでXperia選ぶようになるかと言うと...。。)

15:44:19 @cv_k@misskey.dev
icon

20日からVISAでのニコニコプレミアム支払いも一時停止となっているようです

本記事でご案内しておりました「すべてのVisaでのプレミアム会員料金の決済一時停止」につきまして、2024年5月20日(月)以降より順次一時停止することとなりました

(5/15追記)【重要】Visaでのニコニコプレミアム会員料金の決済一時停止について|ニコニコインフォ
https://blog.nicovideo.jp/niconews/222629.html

Web site image
【重要】Visaでのニコニコプレミアム会員料金の決済一時停止について|ニコニコインフォ
13:39:58 @cv_k@misskey.dev
icon

トヨタ「GRヤリス」、進化型と従来型を公道で乗り比べ https://nordot.app/1168388662272360816?c=559314306504344673

Web site image
トヨタ「GRヤリス」、進化型と従来型を公道で乗り比べ | Car Watch
Attach image
10:42:39 @cv_k@misskey.dev
icon

WWDC2024 開催日決定

:apple: AppleのWWDC、6月10日から5日間開催。最新ソフトウェアと技術が発表
https://nordot.app/1168358497696219414?c=559314306504344673

Web site image
AppleのWWDC、6月10日から5日間開催。最新ソフトウェアと技術が発表 | PC Watch
Attach image
10:17:10 @cv_k@misskey.dev
icon

:microsoft: 日本MS社長のCopilot (生成AI)の使い方。「AIの筋トレ」については使っていて感じるところが多く、日常の様々なところでAIを活用して情報を入れて教育をしていくことでより最適化された回答が得られるようになる


知っ得!企業トップのAI活用法。日本マイクロソフト社長のCopilotの使い方がすごく勉強になる
https://nordot.app/1167950159325250458?c=559314306504344673

Web site image
知っ得!企業トップのAI活用法。日本マイクロソフト社長のCopilotの使い方がすごく勉強になる | PC Watch
09:22:57 @cv_k@misskey.dev
icon

Googleサーチアルゴリズム漏洩 Mastodon/Misskey等のFediverseユーザーが気にするところは「13. ショートコンテンツの独創性を評価」で、マルチポスト駆使しまくっていると検索してそっちにたどり着きにくい(そもそもTwitter(X)のほうが圧倒的に他のスコアが高い)という現象が起きてるかもですね :crying_ai:

Web site image
takimura@​:misskey:​.dev​​:spi: (@cv_k)
09:15:11 @cv_k@misskey.dev
icon

今のGoogleがページのタイトル要素をあまりにも重視しなさすぎる結果返すのも謎だったがだいたい合点のいく理由が分かってしまった

09:06:06 @cv_k@misskey.dev
icon

昔Googleの中の人だった人が冗談半分にChrome出したのは世界中のユーザーのウェブの利用履歴知りたかったとか言っていたが事実だと判明しちゃったではないか :innocent_ai:

09:01:44 @cv_k@misskey.dev
icon

続き

17. ゴールドスタンダードはある

goldenというフィーチャーで人間あるいはAIにラベルされたコンテンツは実在する。
https://paulgraham.com/articles.html とかかな笑

18. Embeddingによるトピックチェック

ページのコンテンツがサイトの趣旨に沿ったものであるかどうかをembeddingでチェックしている。これで、サイトにあると違和感を感じるような内容かどうかをチェック。

19. 零細個人サイトは特別扱い?

smallPersonalSiteというフィーチャーで、資金力にものを言わせることができない個人サイトは公平のためブーストしている様子。

というわけで、これまで謎だったGoogle検索エンジンの様々な側面が今回初めて公にリークされたので、可能な範囲で解説してみました。興味がある方は、以下のリンクの原文を当たってみてください。

SEO業界はざわつきそうですね。

09:01:34 @cv_k@misskey.dev
Googleのサーチアルゴリズムが漏洩。大事件だ、ますます検索環境が悪化してしまう可能性が出てきたではないか :angry_ai:
icon

Googleのサーチアルゴリズムが漏洩。

さすがにこの規模のリークは歴史上、初めてのことだと記憶しています。

そして、Google自身は否定していたもののSEO業界では長年疑われていたアルゴリズムの数々が実在していたことも明らかになりました。

2,596個のモジュール、計14,014個のランキング特徴量。

以下、主なものを解説していきます。

1. ドメイン権威

Googleの公式見解は「我々はドメイン権威のようなものは持っていない」というものだったが、siteAuthorityというfeatureの存在が確認された。

2. クリック

これもGoogleの公式見解と異なり、GlueやNavBoostというランキングシステムにより、クリック情報が検索ランクに影響を与えていることが明らかになった。NavBoostは2005年から存在していて、過去18ヶ月のクリックデータを元にしている。

3. ホスト年齢

hostAgeというフィーチャーの存在によって、生まれたばかりの新しいサイトはやはりサンドボックスに閉じ込められていることが明らかに。hostAgeという言葉自体がhost + ageの合成語だけでなく、一単語で「人質・担保」という意味を持つので言葉遊びですね。

4. Chromeのデータ

Chromeの利用データはサーチに影響しないという公式見解をよそに、やはりChromeのデータは使われていた。使わないわけがないので否定すること自体が公式見解の信憑性を損ねていたと思います。

5. アーキテクチャ

Googleのランキングシステムは単体の巨大なアルゴリズムではなくマイクロサービスの集合体。Trawler (クロール) / Alexandria (インデックス) / Mustang (ランキング) / SuperRoot (クエリー処理) などからなる。

6. リランカー

これに加えて、NavBoost / QualityBoost / RealTimeBoostなどのブースターでSERPの一等地に何を表示させるかを競い合わせている。中でもNavBoostは出現率が高く強力な様子。

7. Pandaアルゴリズム

Amit SinghalがリードしたPandaは、ユーザー行動や外部リンクなどに基づいてランクのスコアを調整する。特許にもなっている。ドメイン、サブドメイン、パスなどの多レベルで適用される。オブザーバビリティを担保するため、あえて機械学習を使ってないという点が印象的。

8. author属性

Google公式のE-E-A-T推奨通り、author属性は特徴量になっていた。ほとんどのサイトやフィードでauthor系メタデータはちゃんと入力されていないケースが多いが、これは対応したほうが良いかもしれない。

9. 降格

リンク先のコンテンツとのミスマッチ、SERPにおけるユーザー行動、UXの不備、検索ワードとドメイン名が完全一致する場合、製品レビュー系コンテンツ、グローバルページ、ポルノ、などは降格される。

10. リンクグラフはまだまだ重要

sourceTypeなどのメトリックによりリンクの重みが変わる。インデックス・ティアに分けられ、重要度高・更新頻度高・アクセス頻度高のコンテンツはより高速なフラッシュメモリに保存され、ティアの低いインデックスはハードディスクに保存される。

11. リンクスパムはベロシティ・シグナル重視

スパムは短期間に大量投下されたもののスパイクを検出することを特に重視している。怪しいものを見つけたら現在のベースラインと比較して異常値を検出。

12. 最新20件のページ更新履歴を保持

インデックスされたページの評価が高まってから変更して別のコンテンツに誘導するなどのハックを防ぐために過去20件の変更履歴を保持していることが判明。逆にいうと最大20件とバレてしまったので狙われそう…

13. ショートコンテンツの独創性を評価

Twitterのようなショートコンテンツでは、OriginalContentScoreにより、文字数をカウントし、オリジナリティを評価。

14. 日付は重要

鮮度は重要。bylineDate / syntacticDate / semanticDateなどにより、コンテンツの正確な日時情報を様々な角度から抽出している。

15. ビデオサイトは別扱い

もし50%以上のページがビデオならビデオサイトとして扱う

16. Your Money Your Life (YMYL) も特別扱い

公式情報通り、お金や健康など人生にクリティカルな影響を与える情報はより厳格に扱われる。

:twitter: https://twitter.misskey.dev/status/1795500175487832491

00:40:46 @cv_k@misskey.dev
icon

寝室に余ってる4Kモニター移動してFireTV使えるようにした :yay_ai:

Attach image