HOME > 2024年05月30日
このエントリーをはてなブックマークに追加

2024年05月30日

【重大事件】Googleのアルゴリズム情報が漏洩か?!

2024年05月30日

2024年5月27日、Googleの内部文書が流出したという記事がアップされました。この記事はランド・フィッシュキン氏という海外のSEOの世界で非常に著名な人物で、氏によると漏洩したドキュメントが元Google社員によって本物であることが確認されているというものです。

ウェブサイトのコンテンツ、リンク、ユーザー行動等に関するデータの詳細や、Googleがランキングに使用している機能の詳細な説明が書かれている文書が漏洩され、誰でもこちらからダウンロードできる状態になっているというものです。これは厳密に言うとGoogleのアルゴリズムというよりはAPIに関する社内文書だと思われます。APIとは、Application Programming Interface(アプリケーション・プログラミング・インターフェース)の略称です。簡単に言うと、あるソフトウェアやサービスが持つ機能を、外部のプログラムから利用するための窓口のようなものです。

この文書によると、Googleは少なくとも1万4000以上のランキング機能を使用しており、これらは2,500以上のモジュールに分類されているとのことです。具体的なスコアリング関数の詳細は含まれていませんが、crawling、indexing、rendering、processing、ranking、servingなど、様々なランキングシステムに関する豊富な情報が記載されています。

興味深いのは、文書の内容がGoogleの広報担当者達が過去に発言してきたことと矛盾する部分が多数あることです。例えば、Googleはドメインオーソリティのようなものは使っていないと主張してきましたが、実際には「siteAuthority」という機能の記述があることがわかりました。また、検索結果上のクリック数やクリック率はランキングに使われていないと主張してきましたが、NavBoostというシステムでクリックデータが使われていたことも判明しました。

新しいサイトを隔離するサンドボックスの存在も否定されてきましたが、実際には存在していたのです。Googleのサンドボックスとは、新しいウェブサイトや、何らかの理由でGoogleから信頼を得ていないウェブサイトを一時的に検索結果の上位に表示しにくくする仕組みのことを指します。サンドボックスに入ったウェブサイトは、一定期間、検索結果での順位が低く抑えられます。これは、スパムサイトや低品質なサイトが検索結果の上位を占めることを防ぐための措置だと考えられています。

さらに、Chromeブラウザのデータはランキングに使われていないとも主張されてきましたが、この漏洩文書が本物ならば、実際にはChromeからのデータが使われているということになります。つまりChromeブラウザを使っているユーザーが検索結果のどのリンクをクリックしたかや、その後どのサイトに行ってどのページのリンクをクリックしてどこにいき、そこで何分間ページを見たかなどの個人情報がGoogleのサーバーに送信されそのデータが検索順位を決めるのに使われているということになります。

このようにGoogleの広報担当者達の発言と実際の内部文書の内容には大きな矛盾が見られます。文書からは、Googleのランキングアルゴリズムが、単一の巨大な数式ではなく、複数の小規模なプログラムで構成されていることがわかります。大雑把に言うと、crawling、indexing、rendering、processing、ranking、servingの各段階で様々なシステムが動作し、最終的なランキング結果を生成しているのです。

文書から明らかになった主な点には次のようなものがあります。パンダアルゴリズムは、参照したクエリ数とリンク数の比率に基づいてスコアを調整しています。記事の著者名はランキングを決める際に考慮されており、クエリとドメインの完全一致、商品レビュー、ポルノ、ユーザーの所在地などに基づく様々な順位の降格システムが存在することもわかりました。

リンクのインデックス層がそのリンクの価値に影響し、トップページ(海外ではホームページと呼ばれるページ)のPageRankと信頼性はサイト内の全ページに影響を与えるということです。文字数が少ないコンテンツは独自性がどれだけあるかに基づいてスコアリングされ、ページタイトルとクエリのマッチ度は現在でも重要視されているということです。つまり、タイトルタグにキーワードを含めることは現在でもSEOに有効だということになります。ページの日付情報は非常に重要で、構造化データ、ページタイトル、XMLサイトマップで一貫性を保つ必要があります。

Googleはこれまでドメインネームの登録情報を見ていないとされていましたが、実際にはドメイン登録情報がページ単位で保存されていることや、動画中心のサイトが特別に扱われていること(恐らく検索にかからないように低く評価されている)、YMYLコンテンツが特別にスコアリングされていることもわかりました。さらに、Googleはサイト全体のテーマを把握して、各ページがトピックからどれだけ離れているかを測定していることや、小規模な個人サイトを意図的に不利に扱っている可能性がるということです。
《関連情報》 YMYLとは?

このように、この漏洩した内部文書からは、Googleのランキングアルゴリズムに関する重要な情報が多数明らかになりました。SEO業界はこれまでGoogleから批判されてきましたが、実際にはSEO業界の主張の多くが正しかったことが証明されたと言えるでしょう。私もこれまでセミナーやニュースレター、YouTube動画で述べていた多くの仮説が本当だっと思うととても嬉しく感じます。ただし、この漏洩文書はフェイクの可能性も少しはあるので100%鵜呑みにはできませんが、かなりリアルでありプログラミングについての見識が高い人が見ればかなりの確率で本物であるはずと思う内容になっています。

SEO業界は実験とデータ分析を通じてGoogleのアルゴリズムを理解し、適切な最適化を行っていくことが重要です。Googleの広報担当者達が発表したこと、否定したこと、陰謀論だと断定したことをそのまま額面通りに受け取ることは危険です。

絶えずジャーナリズムの精神を持って批判的に捉え、自らの頭脳と経験に基づいて真意を判断する必要があります。権威があるから、高学歴だから、有名だからといって相手の言うことをそのまま信じてはなりません。真実なのか、嘘なのか、それは自分の力で判断する必要があります。

そして結局は、Google検索で上位表示をするためには検索ユーザーのニーズを理解し、それに合致する高品質なコンテンツを制作し、それを使いやすくデザインされたウェブサイト、ウェブページ内で提供することが求められます。それこそが真のSEOであるはずです。

このエントリーをはてなブックマークに追加
                    
鈴木将司の最新作品
プロフィール
一般社団法人 全日本SEO協会 代表理事

 鈴木将司

フォローしてSEOを学ぼう!
X facebook insta tiktok youtube
<< 2024年 05月 >>
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  
最新記事