グーグルエンジンの仕組みとSEO

現在、検索エンジンのシェアをグーグルが寡占している状況です。ですから、検索エンジン最適化というのは、グーグルに最適化するということになります。グーグルの検索エンジンは、ウェブページをクロールしえ情報を取得する、取得した情報をインデックスする、検索ニーズに合致したページを返すとなります。グーグルにはウェブクローラと呼ばれるソフトウェアを用いて、インターネット上のウェブページの情報を取得します。googlebotが収集したデータは、検索エンジンが処理しやすい形式に変換されます。そしてデータベースに保存されます。こういった処理のことをインデックスと呼びます。例えば書籍の索引のイメージで作成されています。インデックスの時には、情報をそのまま保存するというだけではなくて、ページに含まれるキーワードや公開からの経過時間といった、さまざまな追加情報も一緒にデータとして保存されることになります。グーグルのインデックス情報には、数千億ものウエブページが登録されています。そのサイズは1億ギガバイトを超えるともいわれています。ビッグデータの処理というのは、簡単にはいきません。グーグルはインデックス処理の遅延を問題視。2010年には、インデックスシステムを新たに構築しています。ユーザーが入力した検索ワードに合致したページを返すには、主に検索キーワードの分析、検索キーワードの照合、ページのランキングといった3つの処理を含みます。検索キーワードの分析というのは、ユーザーが入力したキーワードの意味、意図を把握するということです。この分析処理には、同音異義語も区分することができるほど高度な言語技術が応用されています。