301リダイレクト:301リダイレクトとは、あるURLから別のURLへ恒久的にリダイレクトする処理のことです。サイト訪問者や検索エンジンを、ブラウザーに入力したアドレスや検索結果ページで選択したページ以外のURLにリダイレクトします。バックリンクを基準にしたPageRankやバックリンクアンカーテキストのようなランキングシグナルをリダイレクト元ドメインからリダイレクト先のドメインへと転送し、ウェブサイトのオーソリティーを維持できるため、結果としてランキングが上がります。このため、SEOの観点からは恒久的な301リダイレクトの方が一時的な302リダイレクトより好ましいとされています。ただし、Googleのように長時間使い続けると302を301として扱う検索エンジンもあります。検索エンジンはユーザーが同一人物であることを認識するのです。(出典:HubSpot)
302リダイレクト:あるURLから別のURLへ一時的にリダイレクトする処理です。302リダイレクトが設定されたURLを入力すると、指定された別のURLへリダイレクトされます。以前は、検索エンジンは302リダイレクトを有効なアドレス変更と認識していなかったため、元のURLから新しい一時的なURLへとランキングの決定要素が転送されることはありませんでした。しかし、2016年以降は状況が変わりました。(出典:HubSpot)
307リダイレクト:一時的なリダイレクトです。クライアントには、リクエストされたリソースが移動したというメッセージが表示されます。HTTPリクエストを送信したユーザーを元のURLではない別の場所にリダイレクトする点で302リダイレクトと似ていますが、新しいURLへリクエストを再送信するにはクライアントの承認が必要である点が異なります。ほとんどのブラウザーはリクエストを自動的に再送信します。
403 Forbidden:ユーザーがURLにアクセスしたときにHTTPサーバーからユーザーに送信されるHTTPステータスコードの1つです。このエラーは、クライアント側のアクセス権限が削除または制限されているか、ウェブサーバーの構成が誤っていることが原因で、クライアント(ユーザー)のアクセスが禁止されたことを示しています。(出典:HubSpot)
404エラー:このエラーメッセージは、サーバーがユーザーにリクエストされたリソースを見つけられなかったことを示しています。クライアント側のエラーです。ウェブページのコンテンツが削除されたか、別のURLに移動しているのに新しい場所へのリダイレクトが設定されていません。または、入力されたURLが間違っています。(出典:HubSpot)
405エラー (Method Not Allowed):HTTPレスポンスステータスコードの1つです。閲覧者がウェブページにアクセスする際、ウェブブラウザーからサーバーに対してアクセス要求が送信され、自社のサーバーがその要求をHTTPメソッドとして受信したことを示します。(出典:HuhbSpot)
410エラー:このエラーメッセージは、ユーザーがリクエストしたURLにあったコンテンツがなくなったことを示しています。以前はそこにあったものが現在は存在していないということです。404エラーと似ていますが、検索エンジンにより多くの情報が提供されます。特にそれが以前にインデックスされたページである場合、検索エンジンは「コンテンツがなくなったため、そのURLのインデックスを解除してもよい」という情報を受け取ります。(出典:Blue Corona)
500エラー:このエラーメッセージは、サーバー側で問題が発生したことを示しています。そのため、サーバーはユーザー(およびクライアント)からリクエストされたコンテンツを提供できません。一般的なエラーであり、サーバー側で具体的にどのような問題が起こったのかはわかりません。
(画像出典)
502 Bad Gateway:ウェブサイトのサーバーの通信状態に問題があることを示す一般的なエラーメッセージです。「一般的なエラー」とは、具体的にどのような問題が起こっているのかがわからないということです。このエラーが発生すると、下の画像のようなページが表示されます。(出典:HubSpot)
503エラー:このエラーメッセージは、リクエストされたコンテンツをホストしているサーバーがリクエストを処理できない状態であることを示しています。サーバーのメンテナンス中であるか、サーバーが過負荷状態である可能性があります。サーバーはまだ正常な状態に戻っておらず、現時点ではユーザーのリクエストを処理できないことを通知しています。(出典:HubSpot)
504 Gateway Timeout:これは、ウェブサーバーがウェブページを読み込む際に、上流の別のサーバーからの応答がすぐに得られなかったことを示します。(出典:HubSpot)
絶対URL(Absolute URL):ウェブアドレスに特定のリソースを見つけるために必要な情報がすべて含まれているURLです。具体的には、プロトコル(例:http://、https://)、ドメイン(例:www.hubspot.com)、特定のページやファイルを指定するパスが含まれています。
代替テキスト(Alt text、alt属性とも呼ばれます):ユーザーの画面でウェブページ上の画像を読み込めない場合に、画像の代わりに表示される説明です。このテキストは、目の不自由な人が画面読み上げツールで画像を確認するのに役立ちます。また、検索エンジンのクローラビリティーの向上やウェブサイトの検索順位のアップにも効果的です。(出典:HubSpot)
Accelerated Mobile Pages(AMP):Googleが推進しているウェブ コンポーネント フレームワークです。これを利用することで、モバイルページをほぼ瞬時に表示できるようにし、ユーザーの使いやすさを向上させることができます。AMPは特定のHTMLタグ、CSS、JavaScriptの使用を制限するため、AMPを使用しているページは高速で読み込まれます。つまり、通常のページの読み込みより使用するデータが少ないということです。GoogleはAMPで作成されたすべてのページのキャッシュを保持しているため、この仕組みを利用して、他のソースからページのコンテンツを取得しなくとも、そのコピーのページを読み込むことができます。(出典:Moz)
非同期読み込み(Asynchronous loading):ページのコード内の指示に従ってページの特定のコンテンツを同時に読み込むことです。通常、同期読み込みではブラウザーはページの要素をHTMLの頭から順番に読み込みます。しかし、スクリプトの読み込みを非同期にすると、読み込みの順序が変わります。この方法ではページの読み込み時間が短縮されるというSEOの面でのメリットがあります。しかし、A/Bテストの実行中は非同期での読み込み中にちらつきが発生する可能性があるので注意が必要です。最初にコントロールバージョンが読み込まれ、ちらつきが発生します。その後、変数が表示されます。(出典:Optimizely)
バックリンク(Backlink、インバウンドリンクとも言います):他のウェブサイトに設定された自サイトへのリンクのことで、これを増やすことでユーザーを誘導することができるため、オフページSEO戦略の1つとして活用されます。たとえば、マーケティングの業界イベントの情報が掲載されているblog.hubspot.comに、www.inbound.comという外部リンクがあるとします。この場合、www.inbound.comはblog.hubspot.comからのリンクをインバウンドリンク(バックリンク)と見なします。
バックリンクはSEO戦略を支える柱となるリンクです。この戦略では、ウェブサイトが他のウェブサイトに到達することでバックリンクを獲得します。Googleは特定のサイトへのバックリンクの数からオーソリティーを判断します。バックリンクの数が多ければ、そのウェブサイトまたはウェブページのコンテンツが多くの人にとって有用ということだからです。
ベイト アンド スイッチ(Bait and switch、コードスワッピングとも言います):検索エンジンの結果ページ(SERP)で上位に表示されることがわかっているコンテンツをページに配置するブラックハットSEO戦略です。ページの検索順位が上がったら、そのページのコンテンツを別のコンテンツ(最初からそのページにあった場合には検索順位が低くなったと予想されるコンテンツ)に差し替えます。あまり一般的な戦略ではではなく、正当なSEOの観点からは非倫理的と見なされています。
ブラックハットSEO(Black hat SEO):特定のサイトの検索順位を上げるために、検索エンジンのガイドラインに違反する不正なSEO手法です。非倫理的で、ユーザーの役に立たないだけでなく、多くの場合ペナルティの対象となります。ブラックハット手法には、キーワードスタッフィング、クローキング、プライベート リンク ネットワークの使用などがあります。Google をはじめとする検索エンジンには、ブラックハットSEOを検出するメカニズムがあり、こうした行為が検出されるとペナルティの対象となります。
直帰率(Bounce rate):ウェブサイト上の任意のページにアクセスした後、他のページを見ることなくサイトを去る訪問者の割合です。重要なのは、直帰率は使用する分析ツールによって少しずつ定義が異なるという点です。たとえばGoogle アナリティクスの場合、直帰率は「1ページのみのセッション数をすべてのセッション数で割った値のことです。つまり、すべてのセッションの中で、ユーザーが1ページのみ閲覧したセッションが占める割合のことです」。(出典:Google)
もしくは、特定のページを見てサイトを立ち去ったユーザーの割合を、すべてのページで平均した値である場合もあります。
直帰率が検索順位に及ぼす影響についてはさまざまな見方があります。Googleによると、直帰率はランキングの決定要素ではありませんが、多くのSEO戦略では直帰率が高いと検索順位が下がるとされています。
しかし、直帰率が高いからといって必ずしもサイトがユーザーに好まれていないとは言えません。たとえば、ユーザーから寄せられた多くの質問にこと細かく答えるブログ記事を作成した場合に、ユーザーはそのページに長時間滞在した後、他のページを見ないでウェブサイトを去る可能性があります。そのページを見ただけですべての不明点に対する回答が得られるからです。
パンくずリストマークアップ(Breadcrumb markup):パンくずリストマークアップは特定のページの構造を示し、Googleはそれによってページの大まかな構造を把握することができます。コンテンツの構成を簡単に把握できるので、SERPでリッチカード、カルーセル、ナレッジボックス、強調スニペットのような高度な結果を得ることができます。(出典:Moz)
パンくずナビゲーション(Breadcrumb navigation):ウェブサイトのナビゲーションの種類の1つで、ユーザーがサブカテゴリーまたはウェブサイトのその他の関連する特定のページにどのようにして到達したかを確認できます。ユーザーは、パンくずをたどることで、特定のウェブページからページ階層を上ってホームページへと戻ることができます。
(画像出典)
Brotli圧縮(Brotli compression):Brotliは、ウェブサイト上のデータを圧縮してサイズを小さくできるオープンソースのlossless圧縮アルゴリズムです。テキストの圧縮に最適ですが、画像の圧縮には使用できません。SEOが目的なら、現在利用できる最良の手段はgzipではなくBrotli圧縮です。Brotli圧縮は辞書を使用し、フルワードではなくキーを送信することで、高い効率性を実現しています。Brotliはgzipと比べて、HTML、CSS、JavaScriptファイルのサイズも大幅に削減できることがわかっています。BrotliのソースコードはGitHubにあります。
正規URL(Canonical URL):まったく同じ、またはほぼ同じページが2つある場合に、検索エンジンがクロール、インデックス、ランキングするための優先ページです。テクニカルSEOで使用します。重複したページのランキングの決定要素は正規URLに集約されます。httpまたはhtmlヘッダー内でrel="canonical"リンクタグを使って、優先ページであることを示すことができます。
クライアントサイドレンダリング/サーバーサイドレンダリング(Client-side vs. server-side rendering):
この違いはサイト訪問者にどのように映るのでしょうか。大きなポイントは、サーバーサイドレンダリングの方が表示に時間がかかるという点です(最初の1バイトを受信するまでの時間、つまりTTFBが長くなります)。これは、サーバーがすべての部分をまとめて命令を実行してから、訪問者に表示される結果のページコンテンツをクライアントに返す必要があるためです。
SEOの観点からはどのような違いがあり、 どちらが有効かについてもご説明しておきましょう。クローラーにとって解釈しやすいのは、サーバーサイドでレンダリングされるページです。クライアントサイドレンダリングではJavaScriptが多用されますが、クローラーはJavaScriptの解釈が得意ではありません。サイトがクローラーにとってどのくらい理解しやすいかを確認するには、Googleが推奨するモバイル フレンドリー テスト ツールを使用します。このツールは、各デバイスでのサイトのパフォーマンスを把握する目安として利用できます。
さて、レンダリングにはこの2種類しかないのでしょうか。実は、他にも選択肢があります。サイトのアーキテクチャーでクライアントサイドのJavaScriptを大量に使用している場合は、動的レンダリングを採用することでクローラーに解釈してもらいやすくなります(Google)。
クライアントサイドレンダリングとサーバーサイドレンダリングに間には、その中間的な形も存在します。詳しくは以下の図をご参照ください。
(画像出典)
クローキング(Cloaking):ブラックハットSEO手法の1つで、人間のユーザーとクローラーに対し異なるコンテンツを表示させることを言います。実際のコンテンツがJavaScript、Flash、画像のように検索エンジンにとって解釈が難しいもので、このコンテンツの代わりにクローラーにとって理解しやすいコンテンツ(HTMLなど)を表示させたいときに使われることが多いようです。クローラーにとって理解しやすいサイトは、解釈の難しいサイトに比べて検索順位が上がる可能性が高くなります。
コンテンツオートメーション(Content automation):多くのコンテンツが検索エンジンに検索され、検索結果の上位に表示されるように、人間の手を介さない自動化ツールを使ってコンテンツを作成することです。コンテンツがユーザーの意図を考慮して作成されておらず、人の目で見て収集、統合されていないため、この手法はブラックハットSEOと見なされています。
コンテンツプルーニング(Content pruning):サイトコンテンツの価値を評価し、価値の低いページを削除、更新、統合、リダイレクトする戦略です。
国別コード トップレベル ドメイン(Country code top-level domains、ccTLD):トップレベルドメインとは、ドメイン名の末尾に付けられるサフィックスのことです。国別コード トップレベル ドメインは、通常、その国に固有のものです。国別コード トップレベル ドメインは、ウェブサイトのコンテンツが特定の国または地域に居住している人々のために作成されたものであることを検索エンジンに伝える最も確実な方法であるため、SEOでは非常に重要です。なお、ccTLDは言語を伝えるものではないので注意が必要です。ccTLDの一覧はこちらでご確認いただけます。
クロールバジェット(Crawl budget):Googleがクロールでき、クロールしようとしているサイト上のURLの数です。クロール需要とクロール頻度の組み合わせによって決まります。コンテンツの品質が低い、ページにソフトエラーがある、ページがハッキングされている、コンテンツに重複があるなどの問題がある場合は、クロールバジェットが大量に消費され、クロールとインデックスに悪影響が及ぶ可能性があります。(出典:Google)
クロール需要:Googlebotがページをクロールする需要量です。以下の要素が大きくなれば、クロール需要も大きくなります。
クロール深度(Crawl depth):検索エンジンがサイトコンテンツをどの程度インデックスするかを示します。効果的な内部リンクが設置されているサイトでは、クローラーはウェブサイト内を積極的に動き回り、サイトの構造を把握し、新しいページを見つけられます。内部リンクをたどることができない場合、クローラーのサイト内の移動が難しくなります。クロール深度を改善するには、パンくずナビゲーションを使用し、XMLサイトマップをそのまま保持して(GoogleにインデックスさせたいURLディレクトリーを渡す)サイトの表示速度を向上させます。読み込みに時間がかかっていることを検出すると、クローラーはサイトリンクをたどることをやめます。
クロール頻度(Crawl rate):Googlebot(Googleのクローラー)が所定の時間内にサーバーに過剰な負荷をかけることなくサイトをクロールできる回数を示します。Googleはサイトから情報を取得するまでの待ち時間を測定して、サーバーの処理速度を割り出します。サーバーがGooglebotのリクエストにすぐに応答する場合、クロール頻度は高くなります。これはサーバーがより多くのリクエストを処理できることを示します。サーバーからの応答に時間がかかる場合、Googleはサーバーがビジー状態であると判断し、ウェブサイトのクロール頻度を低くします。サイトの処理速度が速いほどユーザーの使いやすさが向上し、クロール頻度も高くなります(Googlebotが、高速なサイトのサーバーは正常に動作しており、過負荷状態でないと判断するのです)。ただし、Googleによると、クロール頻度自体はランキングの決定要素ではありません。(出典:Google)
クロール頻度の制限(Crawl rate limit):Google Search Consoleを使用して、Googleが所定の時間内にウェブサイトをクロールする回数の上限を設定できます。
クリティカル レンダリング パス(Critical rendering path):ブラウザーがHTML、CSS、JavaScriptをサイト訪問者向けの使用可能なウェブサイトに変換するまでの一連のステップです。開発者はウェブサイトのクリティカル レンダリング パスの最適化により、ページが最初にレンダリングされるまでの時間を短縮することができます。クリティカル レンダリング パスの最適化の詳細はこちらからご覧ください。(出典:Google)
(画像出典)
ドメインオーソリティー(Domain authority):ドメインオーソリティー(DA)とは、ウェブサイトのSERPでどの程度の順位になるかを予測するためにMozが作成したサードパーティーの評価指標です。DAのスコアの範囲は0~100です。ウェブサイトのSERPでの順位は、値が100に近づくほど高くなり、値が0に近づくほど低くなります。GoogleではDAはランキングの決定要素ではなく、SERPに影響はありません。DAは、SEO担当者、ウェブマスター、マーケティング担当者、その他のユーザーが、検索エンジンから見てそのウェブサイトがどのくらい強力かを判断するために使用します。
DAはMozの指標ですが、他のSEOツールにも独自の関連指標があります。以下に例を挙げます。
インデックス解除(Deindexation):URLが検索エンジンのインデックスから削除されることです。インデックスは実質的に、検索エンジンが使用するインターネットの住所録の役割を果たします。検索エンジンボットがウェブのクロール中に見つけたすべてのページの一覧だと考えてください。ページをインデックス解除すると、URLが「住所録」から削除されます。
Googleでページのインデックスを解除するには、Google Search ConsoleでURL削除リクエストを送信します。数日または数週間でインデックスが解除されます。コンテンツがGoogleのインデックスから削除されるまでの期間は、Googleの帯域幅とGoogleにとってそのウェブサイトがどのくらい重要であるかに左右されます。単一のページの<head>タグ内に、robots no-indexメタタグを追加できます。以下の例をご覧ください。
否認(Disavow):検索エンジンが品質の低いバックリンク(有害なバックリンク)を考慮しないようにすることです。Googleの場合、Google Search Consoleの否認ツールを使って行えます。ウェブサイトにスパムスコアが高いウェブサイトがリンクしている場合、Googleはサイトがスパムを使ってバックリンクプロファイルを追加しようとしていると判断し、サイトにペナルティを科す場合があります。ペナルティを解除するには、Googleに品質の低いバックリンクを考慮しないよう指示して、悪意がないことを証明する必要があります。否認ツールの詳しい使い方についてはこちらをご覧ください。
DNS:ドメイン ネーム システムの略語です。DNSはインターネットの住所録であり、IPアドレスをユーザーが入力したドメインとマッピングします。たとえばHubSpotのウェブサイトにアクセスするとき、ウェブサイト上に存在するコンテンツの場所を示す数字の羅列(IPアドレス)の代わりにwww.hubspot.comと入力できるのは、DNSを使用しているためです。DNSは複数のレベルのサーバーで構成されています。インターネットユーザーがウェブアドレスを入力すると、これらのサーバーは相互に通信して、リクエストされた情報の場所を見つけ出します。
ドメイン名登録機関:ドメイン名登録機関は、ドメイン名を販売する権利を持つ認定された企業です。MyCompanyName.comのようなドメイン名を購入したい場合は、ドメイン名登録機関から直接またはドメイン名登録機関と契約を結んでいるリセラーから購入します。ドメイン名を購入すると、そのドメインにコンテンツを公開する権利が得られます。ドメイン名登録機関の例:Domain.com、GoDaddy、Bluehost、Register.com、HostGator
ドアウェイページ(Doorway page):特定の検索語句で検索結果の上位に表示させ、その後ユーザーを別のサイトに誘導する目的で作成されたページのことです。ドアウェイページの使用はブラックハットSEO手法と見なされています。SERPの順位が同じ複数のページを最終的に同じサイトに誘導する場合があるからです。この場合、SERPでユーザーが選択できるユニークな結果が少なくなります。ドアウェイページのスパムレベルには幅があります。スパムレベルが最も高いのは、キーワードが詰め込まれた機械生成のコンテンツです。一方、スパムレベルが最も低いのは、それぞれ別の地域をターゲットにしている別々のウェブページから、ユーザーを最終的に同じコンテンツへと誘導するものです。ドアウェイページには隠しテキストが含まれていることが多く、サイトの所有者がユーザーに表示したい最終のページに自動的にリダイレクトすることがあります。
重複コンテンツ(Duplicate content):2つの異なるURLで同じコンテンツ(テキストやその他のページの構成要素の実質的な部分が同じ)が表示される場合、Googleはこれを重複コンテンツと見なします。表示されるのが同じドメインでも、異なるドメインでも、重複コンテンツになります。
意図せずコンテンツが重複してしまう場合もよくあります。たとえば、ディスカッションフォーラムがモバイルデバイス向けに簡易版のフォーラムを生成している場合、2つの別々のURLが生成されます。
重複コンテンツは検索エンジンで多くの問題を引き起こす原因となり、検索順位に悪影響を及ぼしかねません。
通常、検索エンジンは重複ページの一方を選択することで重複コンテンツに対処します。重複コンテンツがあることに気付いたら、正規タグを使ってどちらを検索上位にするかをGoogleに指示します。
動的レンダリング(Dynamic rendering):Webページをレンダリングする方法の1つです。ウェブページにアクセスしているのがクローラーなのか人間なのかを突き止め、それに応じて異なる方法でページを読み込みます。クローラーの場合はクローラー向けに最適化を行い、人間の場合は通常どおりにページを読み込みます。クローラー向けの最適化では、クローラーが苦手とするJavaScriptをレンダラーで処理した後、静的なHTMLを渡します。こうすることで、クローラーはページをはるかに簡単に解釈できるようになります。人間の場合はクライアントサイドの柔軟で高速なレンダリングを利用でき、クローラーにとってはサイトアーキテクチャーを理解しやすくなるため、ページの検索順位が高くなるというメリットがあります。
(画像出典)
E-A-T(Expertise-Authoritativeness-Trustworthiness):「E-A-T(専門性、権威性、信頼性)」は、Googleの検索品質評価ガイドラインが規定している高品質なページの条件です。Googleは、これがランキングの決定要素の1つであることを明らかにしています。Googleの人工知能はE-A-Tのスコアを測定し、E-A-Tが高いページを低いページよりも検索順位で上位にします。
GoogleによるE-A-Tの詳細な分析内容については、「検索品質評価ガイドライン」をご覧ください。
*注:E-A-Tの概念を「Expertise-Authority-Trust」と紹介しているサイトもありますが、これは誤りです。Googleのガイドラインには、E-A-Tは「Expertise-Authoritativeness-Trustworthiness」の略語であると記載されています。
外部リンク(External links):リンクが配置されているドメインの外部にあるウェブページを指定するリンクです。サイトのリンク先の情報ソースが外部にある場合、これは外部リンクになります。他のサイトから自サイトへのリンクも、相手側のサイトからの外部リンクと見なされます。
HTMLでは、このように表示されます。<a href="http://www.otherwebsite.com/">リンク アンカー テキスト</a>:
取得してレンダリング(Fetch and Render):URLを入力すると、Googleからそのページがどのように見えるかがわかるGoogleツールです。Googleからブロックしたいコンテンツが正常にブロックされているかどうかを確認できます。「取得してレンダリング」で、Googleはページのリンクもすべて確認します。プロセスが完了すると、ユーザーから見たページとGoogleから見たページが左右に並べて表示され、比較することができます。比較した結果を見て、修正が必要なエラーを特定することが可能です。
followリンク(‘follow’ links):サイトのリンクにアンカーテキストを追加すると、特に指定しない限り、リンク先のページにオーソリティーを持たせることができます(「nofollowリンク」を参照)。アンカーテキストを作成し、nofollow属性を指定しない場合、検索エンジンにリンク先のページがオーソリティーのあるページであると伝えていることになり、結果として、リンク先のページの検索順位が高くなります。
*注:SEO関連のオンライン記事で、「follow」リンクが「dofollow」リンクと紹介されている場合がありますが、dofollowというHTML属性は存在しません。GoogleにリンクをフォローさせるためにHTML属性を追加する必要はありません。
gzip圧縮(Gzip compression):GoogleがBrotli圧縮アルゴリズムをオープンソース化する以前に、テキスト圧縮のベストプラクティスとして使われていたデータ圧縮アルゴリズムです。Brotliはgzipに比べて、HTML、CSS、JavaScriptファイルの圧縮率が大幅に向上しています。
headerタグ(Header tags):headerタグはページのHTMLの先頭部分で使用するタグで、<h1>、<h2>、<h3>などがあります。サイト訪問者や検索エンジンに、ページの内容を伝えます。<h1>はページのタイトルを示し、<h2>は通常サブヘッダーです。headerタグには、ランキングに使用したいキーワードを含める必要があります。
たとえば、「Your Title Here」というタイトルの記事にしたい場合、HTMLコードは次のようになります。
hreflang:hreflangはHTML属性の1つで、Googleにコンテンツの言語を指示します。これにより、Googleはそのページと同じ言語で検索しているユーザーにコンテンツを提供できます。たとえば、hreflangタグでスペイン語を指定した場合、Googleは検索エンジンの言語設定をスペイン語にしているユーザーに対し、英語版のページではなくスペイン語版のページを表示します。hreflangタグは、同じコンテンツで言語の違うページがあることを示します。hreflangは、通貨、出荷情報、文化の違いなどを踏まえたうえでよく使用されます。
Googleがコード内で言語を指定するときは、ISO 639-1タグを使用します。
hreflangタグは、ページ上のマークアップ、HTTPヘッダー、サイトマップなどで使用できます。以下の例では、スペイン語(スペイン)を指定するために「es-es」を使用しています。
<link rel="alternate" href="http://example.com" hreflang="es-es" />
HTMLサイトマップ(HTML sitemap):人間向けに書かれた、ウェブサイトのナビゲーションの概要です。ほとんどのHTMLサイトマップは、ウェブサイトの下部のナビゲーションにリンクされています。このサイトマップを使って、サイト訪問者は目当てのページを見つけることができます。HTMLサイトマップは本の最後にある索引と似ており、読者が大量のコンテンツの中から特定のセクションを見つけ出すうえで役立ちます。
こちらがHTMLサイトマップの例です。
画像出典:Statcounter
*注:多くの場合、「サイトマップ」と言えば、それは「XMLサイトマップ」のことです。これもサイトのナビゲーションの概要ですが、人間向けではなく検索エンジン向けに書かれています。
ハミングバード(Hummingbird):2013年9月、Googleは検索語句の分析方法を全面的に見直し、アルゴリズムを更新しました。自然言語処理を利用して、検索語句に含まれている語と一致するコンテンツだけでなく、語句全体の背後にある意味を汲んで検索できるようになりました。これに伴い、ナレッジグラフの仕組みも改善され、ユーザーが検索結果の1つをクリックしなくても、GoogleがSERP内で質問クエリーにより効果的に回答できるようになりました。(出典:WordStream)
画像圧縮(Image compression):画像圧縮とは、画像ファイルのサイズを小さくするプロセスのことです。その結果、ストレージの占有スペースが小さくなり、読み込みの速度が向上します。画像圧縮を行うと、読み込み時間が短縮され、ユーザーの使いやすさが向上し、検索エンジンのクローラーを最適化することができます。
画像圧縮には、lossy圧縮とlossless圧縮があります。lossless圧縮では、写真の品質が保持されます。圧縮ファイルを開くと、メールで送信したときやウェブサイトにアップロードしたときと同じ品質で写真が表示されます。lossy圧縮は写真データの一部を削減します。このため、圧縮ファイルを開いたときの画像の品質が低下します。ただし、lossy圧縮された写真は、lossless圧縮された写真に比べて、ストレージの占有スペースが小さくなります。(出典:KeyCDN)
画像サイトマップ(Image sitemap):画像サイトマップは、サイト上の写真に関するメタデータを提供するXMLファイルです。検索エンジンは画像に関するより多くのコンテキストを得て、他の方法よりも多くの情報を得ることができます。メタデータには、写真のタイトル、ソース、場所、その他の情報を含めることができます。画像サイトマップの例は、こちらをご覧ください。
内部リンク(Internal links):サイト上のアンカーリンクで、同じドメインの別のページへと移動するリンクです。たとえば、www.hubspot.com上にあるhttps://www.hubspot.com/pricing/へのリンクは内部リンクになります。どちらのページもhubspot.comという同じドメインにあるためです。
JSON-LD(JavaScript Object Notation for Linked Data):JSON-LDは、リンク済みデータをエンコードできる構造化データマークアップです。基本的に人間が読み書きしやすい方法でデータを整理します。次のように、属性と値を組み合わせて使用します。
画像出典:JSON-LD.org
Ruby、C#、Python、JavaScriptなど、さまざまなプログラム環境で使用できます。
キーワード密度(Keyword density):1つのウェブページで同じキーワードがどのくらいの割合で出現しているかを測定した値です。1つのウェブページでの同じキーワードの出現回数をページ内の総単語数で割ると求められます。
以前は、キーワード密度が高い方が検索エンジンにサイトのコンテンツを伝えやすいため、SEOに適していると考えられていました。しかし、「キーワードスタッフィング」で同じキーワードを不自然に何度も使用することで、ユーザーの使いやすさが低下する事態が発生したため、Googleはキーワード密度をランキングの決定要素として使用することをやめました。今では多くの検索エンジンが、キーワードを繰り返したり詰め込んだりするスパムのようなウェブサイトをSERPでペナルティの対象にしています。
遅延読み込み(Lazy loading):ページの最初の読み込み時にページ要素をすべて読み込むのではなく、ユーザーが必要な場合にのみ読み込むようなコーディングパターンのことです。たとえば画像カルーセルに複数の画像がある場合、ユーザーがカルーセルをフリップし始めるまで2つ目以降の画像は読み込まれません。
遅延読み込みのSEO効果は用途によって異なります。大きなテキストに、役立つ情報(Q&Aセクション、ブロク記事など)が含まれているとします。このようなコンテンツを遅延読み込みした場合、クローラーはまだ読み込まれていない一部のテキストを完全にスキップしてしまうことがあります。その結果ターゲットキーワードを見逃し、ページ構造を把握できないという問題が発生するおそれがあります。一方、データ量の大きい画像をよく考慮された方法で遅延読み込みすると、ページの読み込み時間が短縮され、ユーザーの使いやすさが向上します。ページの読み込みを始めてすぐに、読み込み時間の長さに愕然とすることがなくなります。(出典:StackPath)
リンクビルディング/被リンク獲得(Link building/link acquisition):リンクビルディングは、他のサイトのウェブマスターに働きかけ、そのサイトから自サイトへのハイパーリンクを獲得するSEO戦略です。関連サイトやオーソリティーのあるサイトからの高品質なバックリンクが多数あると、ウェブサイトの検索順位を大幅に向上させることができます。
リンク購入(Link buying):バックリンクを増やす目的で、他の企業や個人に報酬を支払って、相手のサイトから自サイトへのリンクを獲得するブラックハットSEO手法です。リンク購入はかなり以前からGoogleのサービス利用規約の違反項目となっています。
リンクエクイティー(Link equity):ページAからページBへのハイパーリンクがある場合、ページAからページBにオーソリティーが移ります。オーソリティーの量のことをカジュアルに「リンクジュース」と呼びますが、これはページAのオーソリティーがどのくらいか、各ページのコンテンツにどのくらい関連性があるかによって異なります。ハイパーリンクに指定されている他の指示によっても変わってきます(たとえばnofollow属性が指定されている場合、クローラーはそのページを無視する)。(出典:Moz)
リンクリクラメーション(Link reclamation):他のウェブサイトに体系的にリーチして、自サイトへのリンク切れが見つかった場合に自サイトを修正するプロセスのことです。こうすることで、自サイトのページへのリンクでリンクエクイティーが保たれるようになります。このプロセスは多くの場合、複数のURLの一括変更、ウェブサイトの再設計、コンテンツの変更または削除の後に行う必要があります。自サイトのページへのリンク切れを見つけるのに役立つ複数のツールがあります。リンク切れを修正すると、ユーザーの使いやすさだけでなく、ボットがハイパーリンクをクロールする能力も向上します。(出典:Search Engine Journal)
ローカル ビジネス スキーマ/ローカル ビジネス リスティング(Local Business schema/local business listing):近隣のビジネスをGoogle検索すると、ナレッジグラフ カードが表示される場合が多く、ユーザーは企業の画像、住所、評価、電話番号などの情報を確認することができます。ナレッジグラフ カードに記載する情報をGoogleに指示するには、ローカル ビジネス リスティングのマークアップ規則またはスキーママークアップに従います。情報にタグ付けし、Googleが簡単に見つけられるようにするには、通常ウェブページのHTMLにJSON-LDフォーマットで記述する必要があります。
ローカル ビジネス リスティングで使用できる標準構造化データの定義はこちら、ローカル ビジネス スキーマの完全な定義はこちらをご覧ください。
モバイルデバイスで検索した場合、ローカル ビジネス リスティングは以下のように表示されます。
(画像出典:Google)
メタディスクリプション(Meta description):ページのHTMLのヘッダー内のHTMLタグに含まれるページの概要部分です。検索エンジンと検索ユーザーにページの内容を伝えます。検索エンジン向けに最適化されたメタディスクリプションにはターゲットキーワードが含まれており、そのページを閲覧してどのような価値が得られるかを説明する内容になっています。Googleでは、メタディスクリプションは半角で最大160文字に制限されています。Googleによると、メタディスクリプションはランキングの決定要素ではありませんが、検索ユーザーがクリックする価値があるかどうかを判断するうえで極めて重要です。
コードは次のようになります。
<head>
<meta name="description" content="This is where you write your meta description.">
</head>
メタディスクリプションは多くの場合、タイトルタグのすぐ下に記述され、検索エンジンによる検索結果のページのURLのすぐ下に表示されます。SERPでは以下のように表示されます。
meta refreshタグ(Meta refresh tag):meta refreshは、ウェブマスターがHTMLに記述できるコマンドの1つで、指定した秒数が経過した後にページを更新するようブラウザーに指示します。<meta>タグで、http-equiv属性の値としてrefreshを指定します。Googleは、最初に読み込んだページではなく、更新時のページをインデックスします。これは、クリックしたページにユーザーを誘導したすぐ後に別のページに転送しようとするスパム行為を避けるためです。
たとえば、20秒後にページを更新する場合のコードは以下のようになります。
meta refreshタグの秒数として0を指定し、追加のURL属性に遷移先のURLを指定することで、リダイレクトを実装することもできます。
すぐにページを更新し、遷移先のURLにリダイレクトする場合は以下のようになります。
ただし、Googleでは、meta refreshタグより301リダイレクトを使用することを推奨しています。meta refreshタグを使用すると、突然他のアドレスにリダイレクトされるため、ユーザーの誤解や混乱を招くことがあり、検索エンジンはこのサイトをスパムと見なし、検索順位を下げる可能性があります。
最小化(Minification):ページのコーディングの後、ページを公開する前に行うプロセスです。ページから不要なデータをすべて削除し、できるだけ高速でページが読み込まれるようにします。最小化のテクニックとして、ページの余白を削除したり、変数や関数の名前を短くしたりする方法があります。最終的にはページの読み込み時間が短縮されるという効果があります。最小化を利用すると、PageSpeedが向上するため、SEO効果があります。(出典:StackPath)
モバイル ビューポート タグ(Mobile viewport tag):ビューポートとは、特定のデバイスでユーザーが表示できるページの領域のことです。モバイル ビューポート タグは、ページのヘッダーの<meta>タグ内に記述され、ブラウザーにページのサイズの扱い方を指示します。このタグを使用するのは、通常、デスクトップコンピューターの方がモバイルデバイスよりページ幅が広いためです。ビューポートタグを使って、ページがモバイル対応であることを検索エンジンに示すことで、検索順位が上がりやすくなります。
すべてのデバイスで最大幅を同じにするのではなく、使用するデバイスの幅に応じてページ幅を調整するようブラウザーに指示するには、次のようなコードを使用します。
「width=device-width」で、ページのレンダリングの際にデバイスの幅を考慮するようブラウザーに指示します。また、「initial-scale=1」で、ページの初回読み込み時には初期のズームレベルを使用するよう指示します。(出典:W3Schools)
同じページに2つの画像が含まれていて、一方のみにビューポートのメタタグが指定されている場合は、以下のようになります。
(画像出典:W3Schools)
モバイルファーストインデックス(Mobile-first indexing):デスクトップバージョンのページよりもモバイルバージョンのページを優先してクロール、インデックス、ランキングの判定を行うGoogleの施策です。Googleはレスポンシブ ウェブ デザインを好み、デバイスの種類ごとに異なるURLが用意されている場合はモバイルバージョンのURLを優先してインデックスします。また、AMP HTMLで作成されたページを優先します。この他にもいくつかのベストプラクティスがあります。2018年後半の時点で、Googleの検索結果ページに表示されるページの半分以上は、この手順でクロールされました。2019年5月の時点で、新規にクロールされたすべてのページは、モバイルファーストインデックスを使って評価されています。
nofollowリンク(‘nofollow’ link):nofollow属性は、アンカーリンクのHTMLに追加され、リンク先のページにオーソリティーを渡したくないことをGoogleに伝えます。2019年9月、Googleはnofollow属性の扱いをGoogleへの命令からヒントへと変更しました。Googleは、「ページにリンクしたいが、リンク先のページにランキングクレジットを渡すことを含め、どんな種類の推奨も暗示したくない」場合にnofollow属性を使用するよう推奨しています。(出典:Google)
オーファンページ(Orphan page):他のページからリンクされていないページのことです。オーファンページはSEOの面で問題があります。ウェブクローラーは既知のページ上のリンクをたどって(クリックして)新しいページをクロールし、インデックスするので、サイトのXMLサイトマップにそのページを追加して検索エンジンに送信しない限り、検索エンジンはオーファンページの存在を知る術がありません。オーファンページをサイトマップに追加した場合でも、他のページからこのページにオーソリティーが渡されないため、ウェブマスターの希望どおりにSERPに表示される可能性は低いでしょう。また、そのページでの検索エンジンの構造上のコンテキストも制限されることになります。
ページオーソリティー(Page authority):ページオーソリティー(PA)はMozが開発した指標の1つであり、特定のウェブページが検索エンジンにおいてどのくらい上位に表示されやすいかを見積もります。PAのスコアの範囲は0~100です。ウェブサイトがSERPで上位になる可能性は、値が100に近づくほど高くなり、値が0に近づくほど低くなります。GoogleではPAはランキングの決定要素ではなく、SERPに影響はありません。PAは、SEO担当者、ウェブマスター、マーケティング担当者、その他のユーザーが、検索エンジンから見てそのウェブサイトがどのくらい強力かを判断するために使用します。
ページランク(PageRank):すべてのウェブページに、インターネット上の他の関連ページと比較したときの相対的な重要性と権威性のスコアを付けるGoogleのアルゴリズムです。他のページからそのページへのリンクの品質と数が考慮されます。各ページに1から10までの公開スコアが付けられますが、リンクプロファイルが強力な(ドメイン内外の権威性の高いページからのリンク数が多い)ページは、ポイントが高くなる可能性があります。ページへのリンクの数よりも品質の方が重視されるようになってきています。(出典:Bruce Clay、LinkAssistant)
PageSpeed Insights:PageSpeed Insights(PSI)は、デスクトップとモバイルのページの表示速度を分析し、改善方法についてのインサイトを提供するGoogleツールです。特徴としては、First Contentful Paint(ページへのナビゲーションの後、ブラウザーがDOMコンテンツの最初の要素をレンダリングするまでの時間)とFirst Input Delay(ユーザーがページで何らかの操作を行った後、応答が返ってくるまでの時間)に注目します。
ページの表示速度はGoogleでの表示順位に影響を及ぼすため、Googleのアドバイスに従って表示速度を改善すると、SEOに効果的です。一般的なページの表示速度の改善方法として、最小化、リダイレクトの使用の制限、サーバー応答時間の改善、レンダリングを妨げるJavaScriptの削除などがあります。(出典:Google)
ページネーション(Pagination):シリーズの一部である複数のページのHTMLのhead部分に記述する一連の指示です。同様の方法で構成された類似のコンテンツのページが複数ある場合(たとえばブログの検索結果が複数のページにわたっている場合や、eコマースサイト上の特定のカテゴリの製品が複数のページにわたっている場合)、ページネーションを使って、特定の順序で、URLがわずかに異なる複数のページにコンテンツが分割していることを検索エンジンに知らせることができます。
例を見てみましょう。
HubSpotのマーケティングブログの記事は複数のページにわたっています。最新の投稿が表示されている1ページ目のURLはhttps://blog.hubspot.jp/です。2ページ目のURLはhttps://blog.hubspot.jp/page/2、3ページ目はhttps://blog.hubspot.jp/page/3です。
各ページで正規タグとrel=”prev”属性およびrel=”next”属性を適切に使用することは、ページ付けされた結果の構造を検索エンジンに伝えるうえで重要です。(出典:Search Engine Journal)
パンダ(Panda):検索結果で高品質のサイトを低品質のサイトより優先することを目的として、2011年から2015年にかけてGoogleが展開した一連のアルゴリズムの更新です。具体的には、詳細で信頼性の高い情報を提供するサイトを評価し、重複したコンテンツ、広告、価値のないコンテンツ、ユーザーが生成した低品質のコンテンツ(質の悪いゲストブログ投稿など)を大量に含むサイトにペナルティを科します。(出典:Moz)
ペンギン(Penguin):2012年から2016年にかけてGoogleが展開した一連のアルゴリズムの更新で、高品質のウェブサイトに対するメリットが大幅に強化されたPandaアップデートの直後に発表されました。Penguinは、リンクスキーム(バックリンクの購入など)やキーワードスタッフィングを行っているサイトにペナルティを科す点に焦点を当てていました。(出典:Search Engine Land)
Query Deserves Freshness(QDF):2011年後半にGoogleが発表したアルゴリズムの更新です。最近のイベント、ホットトピック、定期的に発生するイベントなど、「新鮮な」(新しい)コンテンツを求めているユーザーの検索語句を特定するために使用されます。
Rel=canonical:重複したコンテンツを使用している場合に、メイン(正規)のURLのみを検索結果に表示するためのHTML要素です。(出典:Yoast)
Rel=”noopener noreferrer”:ページのハイパーリンクに適用される2つの属性です。サイトのセキュリティーを改善する働きがあります。通常、新しいウィンドウでリンク先を開くようブラウザーに指示する_blankコマンドと組み合わせて使用します。
rel="noopener noreferrer"がSEOに悪影響を及ぼすことを警戒する人もいますが、rel="nofollow"と違ってSEOへの影響は実証されていません。(出典:Search Engine Laws)
相対URL(Relative URL):プロトコル(http://、https://など)やドメイン(www.hubspot.comなど)のようなリソースの場所に関する一部の情報を除外したURLです。参照ページは、指定されていない残りの情報を推測します。
レンダリングをブロックするスクリプト(Render-blocking scripts):ページの読み込みを妨げるスクリプトです。通常、この状況は、ページの見栄えを良くするためにJavaScriptを使った結果、読み込みが遅くなるというものです。(出典:HubSpot)
リッチスニペット(Rich snippet):平均的なリンクよりもウェブサイトの詳細を拡張して表示する検索結果です。この「リッチ」なメディアには、画像、評価、作成者、日付、場所などを含めることができます。(出典:HubSpot)
robots.txt:検索エンジンにサイトのページのクロールやインデックスの方法を指示するファイルです。検索エンジンがサイトをクロールし、コンテンツをインデックスして、その情報を検索したユーザーに情報を提供するのに役立つ重要なファイルです。検索エンジンは、サイトをクロールする前にrobots.txtファイルを参照し、何か指示がないかを確認します。ただし、robots.txtファイルにページのクロール禁止という指示を記載しても、実際にコンテンツのインデックスを防ぐことはできません。インデックスを防ぐには、noindex、nofollow、nosnippet、noimageindex、noarchiveのいずれかの指示を使用する必要があります。(出典:HubSpot)
検索ボリューム(Search Volume)/月間検索ボリューム(MSV):所定の期間(通常は1か月。MSVは月間検索ボリュームの略語)に特定の語を検索するユーザーの数を示す指標です。
サーバー(Server):ネットワーク内で一元化されたサービスへのアクセスを提供するコンピューティングデバイスまたはプログラムです。(出典:Oxford)
SSL:ブラウザーとウェブサーバーがやり取りするデータのプライバシーを保護するために使用する標準セキュリティーテクノロジーです。(出典:HubSpot/SSL)
構造化データ(Structured data)/Schema.org:ウェブページ上の決まった方法で整理、構造化されるデータセットのことです。SEOでは、構造化データは整理され、検索エンジンが情報のコンテキストを把握し、検索ユーザーに正確な結果を返せるように複数のテキストがタグ付けされます。(出典:HubSpot)
タイトルタグ(Title tag):ウェブページのヘッダーに記述する、ページのタイトルを示すHTMLタグです。検索結果では、タイトルタグは最初に表示される、結果の最も重要な行です。マルチタブブラウザーでは、タブの上部にページのタイトルが表示されます。ソーシャルネットワークでは、ページのURLをシェアすると、シェアされた内容の詳細として、多くの場合ページのタイトルが表示されます。以下の画像では、SERPで表示されるタイトル(ページのコード内のタイトルタグで指定)を矢印で示しています。
ウェブクローラー(Web crawler):スパイダーやスパイダーボット(Googlebot、Bingbotなど)とも呼ばれているウェブクローラーはボットの一種で、インターネット上のサイトに体系的にアクセスし、各サイトのページのコンテンツを特定します。さらに、各サイトに関するデータを収集して、検索エンジンに渡します。ウェブクローラーがクロールによって収集した情報は、実質的に検索エンジンのインターネットの住所録であるページのインデックスに使用されます。nofollow属性で指示しない限り、クローラーはページ上のすべてのハイパーリンクをフォローし、これらのハイパーリンクをたどってインターネット上を巡回します。
XMLサイトマップ(XML Sitemap):Googleがクロールする必要のある、ウェブサイトの最も重要なページの一覧です。これらのページにはサイトマップを示す内部リンクはなくてもかまいません。