Google検索のアルゴリズムに関するドキュメントが漏洩?とはいえ昔からSEO界隈では言われていたこと
真偽の程は定かではありませんが、Googleの検索アルゴリズムに関する内部資料が漏れた!とのこと。
昔からGoogleの検索アルゴリズムは好評されていないので、ああでもないこうでもないと情報が飛び交っていたのですが、その答え合わせのような内容でした。リーク情報を翻訳&解説してくださった方のXアカウントはこちら。
1. ドメイン権威
Googleの公式見解は「我々はドメイン権威のようなものは持っていない」というものだったが、siteAuthorityというfeatureの存在が確認された。2. クリック
これもGoogleの公式見解と異なり、GlueやNavBoostというランキングシステムにより、クリック情報が検索ランクに影響を与えていることが明らかになった。NavBoostは2005年から存在していて、過去18ヶ月のクリックデータを元にしている。3. ホスト年齢
hostAgeというフィーチャーの存在によって、生まれたばかりの新しいサイトはやはりサンドボックスに閉じ込められていることが明らかに。hostAgeという言葉自体がhost + ageの合成語だけでなく、一単語で「人質・担保」という意味を持つので言葉遊びですね。4. Chromeのデータ
Chromeの利用データはサーチに影響しないという公式見解をよそに、やはりChromeのデータは使われていた。使わないわけがないので否定すること自体が公式見解の信憑性を損ねていたと思います。5. アーキテクチャ
Googleのランキングシステムは単体の巨大なアルゴリズムではなくマイクロサービスの集合体。Trawler (クロール) / Alexandria (インデックス) / Mustang (ランキング) / SuperRoot (クエリー処理) などからなる。6. リランカー
これに加えて、NavBoost / QualityBoost / RealTimeBoostなどのブースターでSERPの一等地に何を表示させるかを競い合わせている。中でもNavBoostは出現率が高く強力な様子。7. Pandaアルゴリズム
Amit SinghalがリードしたPandaは、ユーザー行動や外部リンクなどに基づいてランクのスコアを調整する。特許にもなっている。ドメイン、サブドメイン、パスなどの多レベルで適用される。オブザーバビリティを担保するため、あえて機械学習を使ってないという点が印象的。8. author属性
Google公式のE-E-A-T推奨通り、author属性は特徴量になっていた。ほとんどのサイトやフィードでauthor系メタデータはちゃんと入力されていないケースが多いが、これは対応したほうが良いかもしれない。9. 降格
リンク先のコンテンツとのミスマッチ、SERPにおけるユーザー行動、UXの不備、検索ワードとドメイン名が完全一致する場合、製品レビュー系コンテンツ、グローバルページ、ポルノ、などは降格される。10. リンク
グラフはまだまだ重要 sourceTypeなどのメトリックによりリンクの重みが変わる。インデックス・ティアに分けられ、重要度高・更新頻度高・アクセス頻度高のコンテンツはより高速なフラッシュメモリに保存され、ティアの低いインデックスはハードディスクに保存される。11. リンクスパムはベロシティ・シグナル重視
スパムは短期間に大量投下されたもののスパイクを検出することを特に重視している。怪しいものを見つけたら現在のベースラインと比較して異常値を検出。12. 最新20件のページ更新履歴を保持
インデックスされたページの評価が高まってから変更して別のコンテンツに誘導するなどのハックを防ぐために過去20件の変更履歴を保持していることが判明。逆にいうと最大20件とバレてしまったので狙われそう…13. ショートコンテンツの独創性を評価
Twitterのようなショートコンテンツでは、OriginalContentScoreにより、文字数をカウントし、オリジナリティを評価。14. 日付は重要
鮮度は重要。bylineDate / syntacticDate / semanticDateなどにより、コンテンツの正確な日時情報を様々な角度から抽出している。15. ビデオサイトは別扱い
もし50%以上のページがビデオならビデオサイトとして扱う16. Your Money Your Life (YMYL) も特別扱い
公式情報通り、お金や健康など人生にクリティカルな影響を与える情報はより厳格に扱われる。17. ゴールドスタンダードはある
goldenというフィーチャーで人間あるいはAIにラベルされたコンテンツは実在する。18. Embeddingによるトピックチェック
ページのコンテンツがサイトの趣旨に沿ったものであるかどうかをembeddingでチェックしている。これで、サイトにあると違和感を感じるような内容かどうかをチェック。19. 零細個人サイトは特別扱い?
https://x.com/kenn/status/1795500175487832491
smallPersonalSiteというフィーチャーで、資金力にものを言わせることができない個人サイトは公平のためブーストしている様子。
これを見て感じたのは、衝撃というよりも「やっぱりそうなのか」です。
インターネットの歴史の中で(と言っても30年も無いくらいですけど)SEO対策というものに振り回された人は多いのではないかと思います。でも、テクニカルすぎるSEO対策は、反対にペナルティを課せられることも度々ありました。
先日、Googleが公式に「Google向けのサイトを作るな。ユーザーのためになるサイトを作れ」ということを言っていたのですが、これは昔から一貫して言っています。
Googleが掲げる理念に最もヒントが含まれていると思います。
Google の使命は、世界中の情報を整理し、世界中の人がアクセスできて使えるようにすることです。
https://about.google/
つまり私たちがWEBサイトを作るときに意識することは
- ユーザーにとって、役立つ・楽しい情報サイト
- 欲しい情報がすぐ見つかるサイト
- スマホで見てもさくさく動く軽いサイト
このあたりが原理原則ではないかな、と。
よく考えたら当たり前といえば当たり前では・・・?と思いませんか。
また、19番目にある「資金力にものを言わせることができない個人サイトは公平のためブーストしている様子」については、インターネットが登場した頃から言われていたことで、これこそがインターネットの真の価値(であってほしい)なんですよね。
資金がない中小企業や個人事業主にとって、ビジネスチャンスが大きく前進した転機となったのですから・・・
急激な上昇は急激な転落を招きます。SEO対策とは、自身の事業のターゲットオーディエンスをしっかりと理解し、質の高いコンテンツを発信することに他ならないです。
そうして全体で良いコンテンツを生み出すことが、インターネットの価値向上なんだと思います。
※Google公式のE-E-A-T推奨については以下の記事に紹介しています。