SEO 2021.01.09

検索エンジンの仕組みについてわかりやすく説明!

検索エンジン 仕組み

作ったコンテンツの内容を検索エンジンに評価してもらうためには、検索エンジンの仕組みを理解することが重要です。

本記事では、検索エンジンや検索アルゴリズムの仕組みについて、わかりやすく解説します。

検索エンジンとは

検索エンジン(サーチエンジン)とは、インターネット上のWEBページや画像ファイルなどの情報を探すシステムです。代表的な検索エンジンには「Google」や「Yahoo!」「Bing」などがあります。

近年ではGoogleの圧倒的なシェア率が続いているので、Googleに合わせた施策と対応が必要です。本記事でもGoogleに絞って内容を解説します。

検索エンジンの仕組み

検索エンジンがサイトを探してから検索結果に表示するまでの主な流れは以下です。

  1. クロール
  2. インデックス
  3. ランキング

それぞれ詳しく見ていきましょう。

クロール

インターネット上を巡回するクローラーというプログラムが、WEB上にあるサイト情報を集めることを「クロール」と呼びます。

クローラーが巡回する道筋は、主に以下の2つです

①被リンクと内部リンクを辿る

外部からのリンクを辿ってくる場合は、クローラーがリンクを発見して巡回するまでに時間がかかります。サーチコンソールを使ってクロールをリクエストすることもできますが、リクエストがすぐに反映されるわけではありません。なお、内部リンクを設定しておくと、サイト内におけるクローラーの回遊性が高まるため、検索エンジンに評価をされやすくなります。

②XMLサイトマップを参照する

XMLサイトマップを定期的に更新してサーチコンソールに登録すれば、検索エンジンがXMLサイトマップの情報を把握してクローラーが巡回に来ます。

XMLサイトマップを参照させると、リンクを経由させる方法よりも巡回をコントロールできるだけではなく、クローラーが効率的に巡回できるというメリットもあります。

XMLサイトマップについては以下の記事で詳しく説明していますので、詳しく知りたい方はぜひご覧ください。

こちらの記事で、さらに詳しく解説しています。

インデックス

クロールして集めた情報を整理してデータベースに登録することを「インデックス」と呼びます。インデックスされなければ、コンテンツを作成しても検索結果には反映されません。

ランキング

Googleは、「検索アルゴリズム」というランキングシステムを使って、インデックスされたサイトを評価の高い順に表示します。

なお、検索順位は「キーワードとコンテンツの関連性」や「サイトの信頼性」といった200項目以上の要素から総合的に判断されます。検索結果の上位に表示されるためには、検索アルゴリズムに最適化させたコンテンツの作成が欠かせません。

検索エンジンに評価されるためには?

検索エンジンに評価されるためには、主に以下の2つを意識することが大切です。

クロール・インデックス最適化

クロールやインデックスでの最適化では、「タグ」や「ファイル」を理解することが重要になります。

robots.txt

robots.txtは、リクエストできるページやファイルをクローラーに知らせるファイルです。

robots.txtを活用すれば、クローラーのトラフィックを管理できるようになります。

なお、robots.txtは基本的に、リクエストのオーバーロード防止に使われます。ウェブページが表示されないようにするファイルではありません。

meta robotsタグ

クローラーの動きを制御するタグです。ページのインデックス拒否にも使えます。低品質なページや作成中のページにmeta robotsタグを設置しておけば、SEOにおける悪影響を防げます。

robots.txtでもクローラーを拒否できますが、robots.txt はあくまでもクローラーのトラフィックそのものを禁止するファイルです。

そのため、インデックスされているページを除外するような場合は、robots.txtではなく、meta robotsタグを使います。robots.txtでクローラーをブロックすると、インデックス除外の指示は適用されません。誤ってrobots.txtとmeta robotsタグを併用しないように注意しましょう。

X-Robots-Tag

metaタグがないHTTPヘッダーには、X-Robots-Tagを使います。機能的にはHTMLファイルに記述するmetaタグと変わりません。

検索アルゴリズムの仕組み

ここからは、検索アルゴリズムの仕組みを詳しくご紹介します。

①検索意図の把握 

検索エンジンのアルゴリズムは、検索意図を把握します。ユーザーが検索を行うと、検索クエリに含まれる単語の意味を分析して最適な回答を返すのです。Google では、独自に検索クエリの単語を解釈する言語モデルも構築しています。

②ウェブページの関連性 

クエリと一致する情報を含んだウェブページを探します。基本的な検索が行われた場合は、インデックス内で検索キーワードに適したページを見つけます。ウェブページの関連性を評価する基準は、検索クエリと同じキーワードが含まれているかどうかです。キーワードがページに出現する頻度が多い場合や、タイトルや見出しに含まれている場合は、関連性が高いと判断します。

③コンテンツの品質 

検索エンジンのアルゴリズムは、キーワードが出現する回数だけではなく、コンテンツの新しさや、ユーザーエクスペリエンスの質なども含めた、様々な要因を分析して品質を評価します。内容の信頼性や権威の評価は、同様の検索クエリで多くのユーザーから評価されているサイトを見つけ、そのサイトからのリンクの有無で判断します。

信頼性や権威性は検索結果の順位に大きな影響を与えるので、ユーザーニーズに応えられる質の高いコンテンツの作成を意識しましょう。

④ユーザビリティ 

ユーザビリティを評価する要因には、以下のようなものがあります。

  • 異なるブラウザでもサイトが正しく表示されるか
  • デバイスごとに最適化が行われているか
  • 接続速度が遅いユーザーでもスムーズに読み込めるか

など

これらのほかにも様々な要因がありますが、「ユーザーがストレスなく利用できるかどうか」が重要です。

⑤文脈の考慮

検索エンジンは、自然言語処理手法「BERT」を採用して文脈を考慮しています。BERTにはアーキテクチャが組み込まれているため、文章を双方向から学習して文脈を読むことができるのです。

BERTはアップデートを繰り返すごとに検索クエリの微妙なニュアンスや文脈の理解度が向上しているため、近年ではロングテールキーワードにも大きな影響を与えるようになっています。

まとめ

今回は、検索エンジンの仕組みをわかりやすく解説しました。

検索エンジンは常に進化しています。現在採用されているアルゴリズムや、検索エンジンの最適化が今後も通用するとは限りません。しかし、ユーザーにフォーカスしたコンテンツの作成が重視される流れは変わらないでしょう。

検索エンジンの仕組みを正しく理解し、ユーザーが求めている質の高いコンテンツを作成すれば、検索エンジンの仕組みが変わっても検索結果の順位上昇が見込めるはずです。

ヒトノテロゴ

執筆者:ヒトノート編集部

株式会社ヒトノテのオウンドメディア、WEBマーケティングの学習帳「ヒトノート -Hito note-」の編集部。

ヒトノテ坪昌史

監修者:坪昌史

株式会社ヒトノテの代表取締役CEO。 エンジニアとしてキャリアスタートし、サイバーエージェントのSEO分析研究機関を経て、リクルートの横断マーケティング組織のマネージャー&全社SEO技術責任者を務める。その後、独立しSEOを中心としたクライアントの課題解決を行う。2017年、株式会社ヒトノテを創業し、様々な企業のウェブマーケティングの支援を行う。

ご質問やご相談など
お気軽にお問い合わせください

お問い合わせ お電話でのご相談は平日10:00-18:00 03-6265-6636