重複コンテンツとは?確認方法や重複コンテンツの基準・対策方法を紹介
重複コンテンツが存在すると、Googleなどの検索エンジンからペナルティが科せられたり、コンテンツの評価が分散したりします。そのため、Webサイト運営者はSEO対策の1つとして重複コンテンツが発生していないか、定期的に対処しなければなりません。
今回は、内部・外部の要因によって発生する重複コンテンツの概要と、SEOに対する影響について解説します。自・他サイト内に存在する重複コンテンツを確認・対策する方法も紹介するため、ぜひ参考にしてください。
1. 重複コンテンツとは?2つの重複パターンも
重複コンテンツとは、異なるURL上にまったく同じ、もしくは非常によく似た文章・画像などが掲載されたページのことです。Web上の著作権侵害にあたる恐れがあります。Google検索セントラルでは、重複コンテンツについて以下のように説明しています。
一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。多くの場合、偽装を意図したものではありません。
引用:Google検索セントラル「重複コンテンツの作成を避ける」引用日2023/11/28
Googleでは、Web上に似たようなコンテンツが複数あったとしても、多くの場合で悪意のある重複コンテンツとは認識しません。なぜなら、重複コンテンツが作成される要因として、Webサイトの構造や設定上の問題があるためです。
ただし「多くの場合は悪意があると認識されない」だけであって、中には悪意のあるコンテンツと認識されるケースもあります。
以下では、2つの重複パターンを悪意のある・なしに分けて解説するため、ぜひ参考にしてください。
1-1. 【内部要因】悪意のない・意図しない重複コンテンツ
Webサイトの構造や設定といった「内部要因」により発生する同一ドメイン内の重複コンテンツは、悪意のない重複コンテンツと言えます。
意図せずに発生する重複コンテンツには、以下のようなパターンがあります。
- wwwの有無やhttps・httpの差など
- 定型文を使用したページ
- Web用の印刷ページ
- PCとモバイルで個別に運用するWebサイト
- パラメータ値が付与されたページ
- 商品の検索や並べ替えによって自動的に生成されたページ
- 色違いで同一の商品を販売する紹介ページ
内部要因によって重複コンテンツが生成された場合、WebページのURL正規化によって問題が解決できるケースがほとんどです。
1-2. 【外部要因】悪意のある・意図した重複コンテンツ
Webサイト運営者が他サイトのコンテンツをコピー・盗用するなど「外部要因」によって発生する重複コンテンツは、悪意のある重複コンテンツと言えます。
自サイトのコンテンツが他者によってコピーされている場合は、Googleに削除申請を行うことが可能です。自サイトのコンテンツがオリジナルだと判断されれば、相手のコンテンツがGoogleから削除されます。
「他サイトのコンテンツをコピーした」とGoogleに判断されるケースは、コンテンツ作成を外部委託した際に起こりやすい傾向です。重複が発覚した場合は、コンテンツを削除するかリライトをしましょう。Webサイトに掲載する前に、重複がないか入念にチェックすることが大切です。
2. 重複コンテンツはSEOにおいてどのようなデメリットがある?
Googleは、ほとんどの重複コンテンツを悪意のないページとみなしています。しかし、重複コンテンツがGoogleから「悪意のあるページ」と判断されると、いくつかのペナルティを受ける恐れがあるため注意が必要です。
以下では、重複コンテンツがSEOに与える影響について解説します。
2-1. ペナルティを受ける可能性がある
基本的に、重複コンテンツの存在だけでペナルティを受けることはありません。しかし、重複するページ数が多すぎて不自然だと判断されたり、他サイトからコピーサイトであると通報されたりした場合は、ペナルティの対象となります。
ペナルティが科せられると、Webサイト全体の品質が悪いとみなされ、検索順位が下がったり圏外になったり、インデックスそのものが削除されたりします。
2-2. 検索結果に反映されない可能性がある
重複コンテンツと判断された場合、該当したコンテンツはインデックスから削除されるため、検索結果に反映されません。
Googleはユーザーの求める答えに辿り着けるよう、コンテンツの多様性を重視しています。そのため、重複コンテンツがあった場合、最もオリジナリティが高く正確だと判断されたページ以外は検索結果から除外されます。
2-3. コンテンツ評価が分散される
ペナルティが科せられなくとも、重複コンテンツが存在するとリンクなどの評価が分散しかねません。
例えば、コンテンツAの評価が100だった場合、コンテンツAと重複したコンテンツBが自サイト内に表れることによって、「コンテンツAの評価50・コンテンツBの評価50」のように、評価が分散する恐れがあります。
2-4. 被リンクからの評価が分散される
コンテンツの重複により、被リンクからの評価も分散します。被リンクとは、他のWebサイトから自社サイトに貼られたリンクのことです。Googleは、サイトの信頼性を判断するために「被リンクの質と量」を指標の1つとしています。良質なサイトからの被リンクを多く集めると、自社サイトの評価も上がり、検索順位の向上が期待できます。
ところが重複コンテンツがあると、本来1つのURLに集中すべき被リンクがそれぞれのページに分散しかねません。例えば、重複した内容を持つ4つのページがあれば、100ある被リンクの数も40:35:15:10といった具合に分散してしまい、各ページの評価が低下します。
Google側が適正に判断して評価を調整してくれる場合もありますが、必ずしも保証されるわけではありません。被リンク評価を最大化するためにも、重複コンテンツの解消が重要となります。
3. 【簡単にできる】重複コンテンツを確認する方法4選
下記で挙げる無料ツールやコマンドを使うことで、重複コンテンツの確認が可能です。
- Google Search Console
- sujiko.jp
- Google検索のコマンド
ここでは、3つの確認方法を使用して重複コンテンツを発見する手順を分かりやすく紹介します。
3-1. Google Search Consoleを使用する
Google Search Consoleを使い、自サイト内で発生した重複コンテンツを見つける手順は以下の通りです。
1 | 左メニューバーの「セキュリティと手動による対策」を開く |
---|---|
2 | 「手動による対策」を選択する |
「問題は検出されませんでした」と表示されれば、自サイト内に重複コンテンツはありません。
他サイトとの重複コンテンツも同時にチェックする方法は、以下の通りです。
1 | 左メニューバーの「インデックス」を開く |
---|---|
2 | 「カバレッジ」を選択する |
「エラー」「除外」となっているページに、重複コンテンツが含まれている恐れがあるため、チェックボックスを有効にして原因を確認しましょう。
3-2. sujiko.jpを使用する
sujiko.jpでは、指定した2つのページの類似度や、Webサイト内外に類似ページが存在するかを調査できます。
sujiko.jpで重複コンテンツを見つける手順は以下の通りです。
1 | 検索窓に調査したいページ、またはWebサイトのURLを入力する |
---|---|
2 | 「判定」をクリックする |
なお、メールアドレスを登録することで1日5回の利用回数上限がなくなります。
3-3. コンテンツ内容の一部を検索する
自社サイトのコンテンツの一部をGoogle検索にかけるのも、重複コンテンツ発見に有効なチェック方法です。重複している可能性のあるコンテンツから文章をコピーして検索画面上部の検索窓に入力し、検索をかけてみましょう。
検索結果の最後尾から似たページを再検索すると、Googleから重複コンテンツとみなされているページを見つけ出せます。また、文章の前後に二重引用符(”)をつけて検索すれば、使用フレーズが完全に一致するページの抽出が可能です。
3-4. Google検索のコマンドを使用する
Googleの検索結果では、重複コンテンツを除外するフィルタが自動でかかります。以下の手順通りコマンドを入力すると、フィルタの解除が可能です。
1 | Googleの検索窓に確認したいURLを入力する |
---|---|
2 | 検索結果ページアドレスバーURLの末尾に「&filter=0」と入力しEnterを押す |
フィルタを解除した際に、自サイトが表示された場合は、Googleから重複コンテンツだと判断されている可能性が高いと言えます。
4. 重複コンテンツを対策する6つの方法
重複コンテンツは、各検索エンジンの評価を下げる原因となります。検索順位の低下を防ぐためにも、重複コンテンツを作成しないように気をつけましょう。万が一、重複してしまったときには、早急な対処が必要です。
以下では、重複コンテンツ対策に有効な対処法を6つ紹介します。
4-1. 301リダイレクトを使用する
301リダイレクトは、ページURLを変更した場合やwwwの有無などによって、重複コンテンツが生成されているものの、コンテンツが1つあれば良い場合に用いる方法です。
301リダイレクトによって、ユーザーが重複コンテンツにアクセスすると、自動的に正規URLに転送されます。旧URLにアクセスしたユーザーを自動で新URLのWebサイトへ遷移させるため、機会損失防止にもつながるでしょう。
Webサイトのドメインを変更した場合、301リダイレクトを設定すれば、以前のWebサイトで蓄積されたGoogleからの評価も引き継ぐことが可能です。
4-2. コンテンツの統合後に301リダイレクトを使用する
複数ページの内容を1つにまとめても問題ない場合は、コンテンツを統合しましょう。ページの統合後に301リダイレクトを設定すると統合先のみが正規のURLとして残り、統合元は評価対象から除外されます。
この方法であれば、古いページの持っていた被リンクの価値を、新しいページへと引き継ぐことも可能です。ただし、リダイレクト設定はサイト内部の構造に大きな影響を与えるため、慎重に行う必要があります。
4-3. canonicalタグを使用する
色違いの商品を紹介しているなどが理由で重複コンテンツを維持する場合や、301リダイレクトが使用できない場合に用いる方法です。
canonicalタグを設定することで、各ページへのリンクやアクセスを可能にしながら、ページに対する評価を正規URLに一本化できます。
canonicalタグを使い重複コンテンツの正規化を行った後、Google Search Consoleでインデックス申請を行いましょう。Googleに正規ページとして素早く認識させ、評価を集中させることが可能です。
管理画面上部の検索窓へ該当ページのURLを入力すれば、コンテンツのインデックス状況を確認できます。「ユーザーが指定した正規URL」と「Googleが選択した正規URL」が一致していれば成功です。
4-4. コンテンツをnoindexさせる
noindexはページを残しつつ、Googleの評価や検索対象から除外する方法です。一般的に、Webサイトの管理者専用のページや、アンケートページなどに設定するケースが多い傾向にあります。
ただし、noindexされたページは、最終的に一切存在しないものとして扱われることになるため注意が必要です。仮に、多くの被リンクが集まっている場合でもすべて無効化されます。
一方で上記のcanonicalタグは「ページAは、ページBと同じもの」という指示になり、双方ページのシグナルを正規とする1つのページに統合可能です。重複コンテンツ対策には、基本的にnoindexよりもcanonicalタグの使用をおすすめします。
4-5. コンテンツの削除または非公開に設定する
重複しているコンテンツのうち必要のないページがあれば、コンテンツの削除や非公開といった対応も有効です。ただし、コンテンツ内にリンクが含まれている場合、SEO評価に影響が出る可能性があります。
対象ページを削除する前に、外部サイトからの被リンクや内部リンクがないかを確認しましょう。ページを削除する場合は、Google Search Consoleを利用してインデックスされたコンテンツ情報の削除を要請することも大切です。
4-6. 定型文の使用を避ける
定型文の多用は、検索エンジンによって重複コンテンツやコピーコンテンツと認識される場合があります。コンテンツ内で定型文や同じ表現を繰り返すのではなく、各ページに合わせて文章を工夫し、類似しないようにすることがポイントです。
同じ情報を伝える必要がある場合でも、言い回しを変える・画像を新しく用意するなどしてコンテンツのオリジナリティを保ちましょう。まったく同じ文章・画像での説明が必要な場合は、引用として記載する・該当記事へのリンクを貼るといった方法が考えられます。
まとめ
自サイト内に重複コンテンツが存在すると「検索結果に反映されない」「コンテンツ評価が分散される」など、Webサイト運営の妨げにつながります。そのため、各種ツールを使用して、重複コンテンツが存在しないか確認することが重要です。
万が一、自サイト内に重複コンテンツが見つかった場合は、URLの正規化やcanonicalタグを使用して対策しましょう。反対に他サイトとの重複コンテンツが見つかった場合は、ページ削除もしくはリライトしなければなりません。
他サイトにコピーされた重複コンテンツであれば、Googleに削除申請を行いましょう。自・他サイト問わず重複コンテンツが見つかった際は、早急な対処が必要です。