HOME > Googleの動向
このエントリーをはてなブックマークに追加

Googleの動向

【重大事件】Googleのアルゴリズム情報が漏洩か?!

2024年05月30日

2024年5月27日、Googleの内部文書が流出したという記事がアップされました。この記事はランド・フィッシュキン氏という海外のSEOの世界で非常に著名な人物で、氏によると漏洩したドキュメントが元Google社員によって本物であることが確認されているというものです。

ウェブサイトのコンテンツ、リンク、ユーザー行動等に関するデータの詳細や、Googleがランキングに使用している機能の詳細な説明が書かれている文書が漏洩され、誰でもこちらからダウンロードできる状態になっているというものです。これは厳密に言うとGoogleのアルゴリズムというよりはAPIに関する社内文書だと思われます。APIとは、Application Programming Interface(アプリケーション・プログラミング・インターフェース)の略称です。簡単に言うと、あるソフトウェアやサービスが持つ機能を、外部のプログラムから利用するための窓口のようなものです。

この文書によると、Googleは少なくとも1万4000以上のランキング機能を使用しており、これらは2,500以上のモジュールに分類されているとのことです。具体的なスコアリング関数の詳細は含まれていませんが、crawling、indexing、rendering、processing、ranking、servingなど、様々なランキングシステムに関する豊富な情報が記載されています。

興味深いのは、文書の内容がGoogleの広報担当者達が過去に発言してきたことと矛盾する部分が多数あることです。例えば、Googleはドメインオーソリティのようなものは使っていないと主張してきましたが、実際には「siteAuthority」という機能の記述があることがわかりました。また、検索結果上のクリック数やクリック率はランキングに使われていないと主張してきましたが、NavBoostというシステムでクリックデータが使われていたことも判明しました。

新しいサイトを隔離するサンドボックスの存在も否定されてきましたが、実際には存在していたのです。Googleのサンドボックスとは、新しいウェブサイトや、何らかの理由でGoogleから信頼を得ていないウェブサイトを一時的に検索結果の上位に表示しにくくする仕組みのことを指します。サンドボックスに入ったウェブサイトは、一定期間、検索結果での順位が低く抑えられます。これは、スパムサイトや低品質なサイトが検索結果の上位を占めることを防ぐための措置だと考えられています。

さらに、Chromeブラウザのデータはランキングに使われていないとも主張されてきましたが、この漏洩文書が本物ならば、実際にはChromeからのデータが使われているということになります。つまりChromeブラウザを使っているユーザーが検索結果のどのリンクをクリックしたかや、その後どのサイトに行ってどのページのリンクをクリックしてどこにいき、そこで何分間ページを見たかなどの個人情報がGoogleのサーバーに送信されそのデータが検索順位を決めるのに使われているということになります。

このようにGoogleの広報担当者達の発言と実際の内部文書の内容には大きな矛盾が見られます。文書からは、Googleのランキングアルゴリズムが、単一の巨大な数式ではなく、複数の小規模なプログラムで構成されていることがわかります。大雑把に言うと、crawling、indexing、rendering、processing、ranking、servingの各段階で様々なシステムが動作し、最終的なランキング結果を生成しているのです。

文書から明らかになった主な点には次のようなものがあります。パンダアルゴリズムは、参照したクエリ数とリンク数の比率に基づいてスコアを調整しています。記事の著者名はランキングを決める際に考慮されており、クエリとドメインの完全一致、商品レビュー、ポルノ、ユーザーの所在地などに基づく様々な順位の降格システムが存在することもわかりました。

リンクのインデックス層がそのリンクの価値に影響し、トップページ(海外ではホームページと呼ばれるページ)のPageRankと信頼性はサイト内の全ページに影響を与えるということです。文字数が少ないコンテンツは独自性がどれだけあるかに基づいてスコアリングされ、ページタイトルとクエリのマッチ度は現在でも重要視されているということです。つまり、タイトルタグにキーワードを含めることは現在でもSEOに有効だということになります。ページの日付情報は非常に重要で、構造化データ、ページタイトル、XMLサイトマップで一貫性を保つ必要があります。

Googleはこれまでドメインネームの登録情報を見ていないとされていましたが、実際にはドメイン登録情報がページ単位で保存されていることや、動画中心のサイトが特別に扱われていること(恐らく検索にかからないように低く評価されている)、YMYLコンテンツが特別にスコアリングされていることもわかりました。さらに、Googleはサイト全体のテーマを把握して、各ページがトピックからどれだけ離れているかを測定していることや、小規模な個人サイトを意図的に不利に扱っている可能性がるということです。
《関連情報》 YMYLとは?

このように、この漏洩した内部文書からは、Googleのランキングアルゴリズムに関する重要な情報が多数明らかになりました。SEO業界はこれまでGoogleから批判されてきましたが、実際にはSEO業界の主張の多くが正しかったことが証明されたと言えるでしょう。私もこれまでセミナーやニュースレター、YouTube動画で述べていた多くの仮説が本当だっと思うととても嬉しく感じます。ただし、この漏洩文書はフェイクの可能性も少しはあるので100%鵜呑みにはできませんが、かなりリアルでありプログラミングについての見識が高い人が見ればかなりの確率で本物であるはずと思う内容になっています。

SEO業界は実験とデータ分析を通じてGoogleのアルゴリズムを理解し、適切な最適化を行っていくことが重要です。Googleの広報担当者達が発表したこと、否定したこと、陰謀論だと断定したことをそのまま額面通りに受け取ることは危険です。

絶えずジャーナリズムの精神を持って批判的に捉え、自らの頭脳と経験に基づいて真意を判断する必要があります。権威があるから、高学歴だから、有名だからといって相手の言うことをそのまま信じてはなりません。真実なのか、嘘なのか、それは自分の力で判断する必要があります。

そして結局は、Google検索で上位表示をするためには検索ユーザーのニーズを理解し、それに合致する高品質なコンテンツを制作し、それを使いやすくデザインされたウェブサイト、ウェブページ内で提供することが求められます。それこそが真のSEOであるはずです。

重大事件が起きるとGoogleの検索アルゴリズムが自動的に切り替わる?

2019年07月13日

Googleの検索エンジン技術者Pandu Nayak氏に英国の大手新聞 The Guardian が取材したところ、Googleは銃撃事件など重大なニュースが報道された時には、権威のあるサイトが自動的に上位表示されるように自動的に検索アルゴリズムを微調整しているということがわかりました。

Pandu Nayak氏は「過去数年の間にいくつもの悲劇的な銃撃事件が発生している。こうした事件が発生すると偽情報が様々な形でネット上に出回ります。こうした状況に対応するために、Googleは悲劇的な大事件が発生したことを自動的に認識し、関連するクエリ(検索キーワード)の検索順位を決める時に権威性を重視したランキング方式を自動的に適用し、偽情報が検索の上位に表示されないように微調整するようにしている」
"In these last few years, there’s been a tragic increase in shootings,” Nayak said. “And it turns out that during these shootings, in the fog of events that are unfolding, a lot of misinformation can arise in various ways. And so to address that we have developed algorithms that recognise that a bad event is taking place and that we should increase our notions of ‘authority’, increase the weight of ‘authority’ in our ranking so that we surface high quality content rather than misinformation in this critical time here."(2019年7月2日)

と同取材で発言しました。

さらに同誌は「権威性とはGoogleの定義によるとGoogle General Guidelinesという166ページに渡るPDFドキュメントで定められた品質評価基準を見ながら16,000人の品質評価担当者たちが評価するものである」
"Authority, by Google’s definition, means pages that comply with the company’s search quality evaluator guidelines, a 166-page document (PDF) that the company distributes to its 16,000 search quality raters."

と伝えています。


【情報元】 The Guardian

このニュースで明らかになったことは:

1、Googleは偽情報を検索結果から追放する努力をしている

2、Googleはいつも同じ検索アルゴリズムですべてのクエリの検索順位を決めているわけではない

3、Googleは権威性が高いサイトを上位表示させることがある

4、権威性はGoogle General Guidelinesを用いる16,000人の品質評価担当者たちが評価する

という事実です。

1、Googleは偽情報を検索結果から追放する努力をしている


昨今、GAFAと呼ばれるGoogle、Apple、Facebook、Amazonらの巨大プラットフォーム企業はEUを始めとする各国政府から監視を強められている状況です。GAFAの筆頭格であるGoogleが万一品質の低い検索結果を提供した結果、社会問題が起きれば莫大な罰金がEU等の政府機関から課せられるリスクがあります。

そうした中Googleは必死で正確なコンテンツのあるサイトを上位表示させ、偽情報や科学的根拠に乏しいコンテンツがあるサイトを検索結果から追放、または下位に表示させる施策を取るのは理解出来ることです。

私達サイト運営者はこうした動きに対応して偽情報と捉えかねない科学的根拠に乏しいコンテンツが少しでもサイト上にあるかを徹底的に確認すべきです。そして少しでもあればそれらを削除または改善しなくてはなりません。

そうしないとGoogleから知らぬ間に信頼性の低いサイトだと認定されてしまい上位表示に不利な状況に追い込まれることになります。しかもやっかいなのは自社サイトが信頼性の低いサイトだと認定されているかどうかを調べるすべはありません。Googleに質問しても教えてくれません。

特に気をつけなくてはならないのが薬機法や医療広告ガイドラインに触れるような医療、健康、美容の情報を取り扱っているサイトや、法律や金融などの分野のサイトであるYMYL業種(Your Money Your Life: 医療・健康サイトのような人の命に関する情報を取り扱うサイトと、投資や金融などの人の経済に影響を与えるサイトの総称)、そして誇大広告的な表現をしている恐れのあるあらゆる分野のサイト運営者です。

2、Googleはいつも同じ検索アルゴリズムですべてのクエリの検索順位を決めているわけではない


以前のGoogleはすべての業種のクエリでの検索順位を決めるアルゴリズムは同じでしたが、近年明らかになってきているのは業種によって有効なSEOテクニックにばらつきが出てきていることです。

例えば、小売業のサイトで上位表示するテクニックは、地域ビジネスのサイトを上位表示させるテクニックとかなり異なって来ています。または医療関連のサイトを上位表示させるテクニックはそれ以外の業種のサイトの上位表示テクニックとはかなり異なるようになっています。

今回の発表によりGoogleは、クエリの種類により異なった検索順位算定のアルゴリズムを使用していることが完全に明らかになりました。一般的なSEOテクニックを知るだけではなく、自社の業界特有のSEOも学び、実践する必要がある時代になりました。

3、Googleは権威性が高いサイトを上位表示させることがある


これは当ブログで以前お伝えしたことですが、Googleは2019年2月15日にリリースした「How Google Fights Disinformation」(Googleはどのようにして偽情報と戦っているのか?)というレポートで「検索ユーザーが検索したキーワードがYMYLに関わるサイトを探すためのものだとGoogleのシステムが検知した際には、検索アルゴリズムが自動的にE-A-T(Expertise:コンテンツの専門性、Authoritativeness:権威性、Trustworthiness:信頼性)が十分にあるサイトが上位表示されやすいランキング方式で算出した検索結果を表示する」と発表していることと符合します。

このレポートではさらに具体的に「Googleのアルゴリズムは信頼性と権威性に関するシグナルを識別します。そのシグナルとはページランクというシグナルであり、ページランクは権威性があるかどうかを理解するためにリンク情報を使います」というようにサイトがどのようなサイトからリンクを張ってもらっているか、権威のあるサイトからリンクを張ってもらっているかが重要であるということがその時明らかになりました。

4、権威性はGoogle General Guidelinesを用いる16,000人の品質評価担当者たちが評価する


「How Google Fights Disinformation」のレポートではサイトに権威があるかどうかは被リンク状況で調査するとだけ書かれていました。しかし今回のニュースでは16,000人の品質評価担当者たちがGoogle General Guidelinesという品質評価マニュアルに基づいて肉眼でサイトを目視したり、ネット上での評判調査をしてサイトに権威性があるかをスコアリングしているということがはっきりしました。

以上ですが、まとめると・・・

Googleにサイトの権威性を認めてもらうためには:

(1)サイト上から偽情報と判断されかねないような信憑性の低い情報を消去する
(2)今後サイト上に客観的事実だと証明できないようなコンテンツは掲載しない
(3)権威のあるサイトからリンクを張ってもらう


この3つの施策をとらなくてはならいということです。

何を言っても良かった無邪気なインターネットの時代がGoogleの影響力の増大とともに終わりました。

今後は、責任ある行動がネットで情報発信をする全ての個人と法人に求められます。

Googleが求人サイトを立ち上げた!それはサイト運営者にとって何を意味するのか?

2019年01月27日

Googleが「Googleしごと検索」というサービスを提供開始したことが大きな話題になっています。

Googleで2019年1月23日から、求人に関するキーワード、例えば「渋谷 ホールスタッフ募集」で検索すると下図のように検索結果の上の方に枠付き3件の求人情報そのものが表示されるようになりました。

そしてその下にある「他 100 件以上の求人情報」というリンクをクリックするとちょうどGoogleマップのような検索結果ページが表示されます。


そこには職種や、地域などを細かく絞り込むことが出来て、「メール通知アラート」をオンにするとユーザーのメールに最新の求人情報が配信されます。



リクルート社が買収して国内でも非常に成功した求人情報業界版のGoogleと言えるIndeedのようなサービスを今度はGoogle自身が行うという点がここまで大きな話題になっている理由ではないでしょうか?

今後は中途半端な規模の求人サイトや求人サービスはGoogleのこの新サービスにより脅威にさらされる可能性が出てきました。

Indeedは元々Googleのようにサイト上の情報をクロールしてインデックスして、仕事を探しているユーザーがスピーディーに自分にあった求人情報を見つけるサービスを提供し成功した会社です。それを2012年の9月に約10億ドル(約1130億円)で買収したと言われています。
【参考】
リクルートの米Indeed買収がお得だった件(日経ビジネス 2017年3月14日)

人々がこのGoogleがIndeedのようなサービスを提供開始したことに騒ぐ本質的な理由は恐らく、どんなにビジネスを成功させたとしても、それがGoogleのような巨大企業が似たサービスを始めればそこで終わってしまうのではないかという恐怖があるからではないでしょうか?

実際に、日本の地図会社もGoogleと提携ができなく、かつデジタルシフト、モバイルシフトできなかった企業の業績が悪化したというニュースが昨年末に報道されたばかりです。

問題は、私たちサイト運営者にとって今回の「Googleしごと検索」のサービス開始は何を意味するかです。

それは単に情報をソフトウェアで自動的に収集し、それを加工するだけでお金が稼げる時代は終わりに近づいているとを認識し、スマートに行動することです。

こうした仕事はGoogleをはじめとするGAFA(Google、Amazon、Facebook、Apple)だけでなく、ソフトバンクとその系列のヤフーや、NTTとその系列企業であるNTTデータ、そしてリクルート社のような企業の得意分野です。
魅力的な条件で非常に優秀な人々を採用して最高のソフトウェアを作り運営できるこうした企業が本気を出せばどのような企業やベンチャーも生存の確率は極めて小さいでしょう。

彼らは優秀な人の集め方に長けているのです。GAFAは優秀な大学が集積する大都市に本社を構え、魅力的なオフィス環境、社会的なステータス、そして報酬を与えることが出来る企業ですので、今後も業績が良い限りはこの傾向は長く続くはずです。

では、その中でもIndeedを運営するリクルート社は大丈夫なのかというと、優秀な学生を集めること自体をサービスとして提供しているくらいですから人材は優秀で、しかも何がコアコンピタンスかというと泥臭い営業に非常に長けていることで有名なのですから今回の脅威のおかげでモチベーションがさらに高まりIndeedはより良いサービスを提供するに違いありません。

では、こうした優れた企業の経営者以外はどうすれば良いのかですが、一言で言うと今は未だソフトウェアだけでは出来ない領域を見つけることと、こうした優れた企業で働く人たちが:

(1)嫌がる仕事(例:かっこ悪い、大企業らしくない)
(2)効率が非常に悪いと思う仕事
(3)市場規模が小さすぎると馬鹿にする分野


です。

これは私がセミナー講師を始めた時から、お節介を承知で受講者の皆さんに時折お伝えする必須3条件です。

これらはある意味、ウイルスに対する免疫力のようなもので、これらのうち1かそれ以上の条件が自社の商材に含まれる限り、諸行無常の食物連鎖の世界で自分より大きな魚に飲み込まれないための生きる知恵です。

1つより2つ、2つより3つ該当すればそれだけ長い時間生存が許されるはずです。

ただ、最近ではGAFAやソフトバンクなどは人工知能に対して投資を加速してきていますので、人工知能が普及してきたらその時間は確実に短くなるはずです。

そのときは仕方がありませんので、人工知能を使って戦う術を獲得する必要性が生まれます。それに失敗したときは不本意ですが、人工知能に使われる側に立たされるでしょうからこちらとしても必死で戦うざるを得ないでしょう。

人材不足で悩んでいる企業は今後自社の求人情報を無料でGoogleにインデックスしてもらい「Googleしごと検索」に表示してもらうことが可能になりました。それにより求人コストの削減が期待できます。

求人情報の登録手順は:
「しごと検索 レファレンス」
https://developers.google.com/search/docs/data-types/job-posting



にあります。Googleが指定したように構造化データを自社サイトに追加すれば誰でも無料で求人情報をアップできます。

今後もGoogleやGAFAなどの巨大企業は新しいサービスをリリースし続けるでしょう。

彼らがやりにくい、やりたがらない領域の事業開発が求められます。
このエントリーをはてなブックマークに追加
                    
鈴木将司の最新作品
プロフィール
一般社団法人 全日本SEO協会 代表理事

 鈴木将司

フォローしてSEOを学ぼう!
X facebook insta tiktok youtube
2024年 11月 >>
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
最新記事