すでに書いているいくつかの記事とそれこそ重複するのですが、「重複コンテンツ」と呼ばれる事象の状態でご相談を受けるという機会が前職時代から現在に至るまでたえないため、「重複コンテンツ」を題目にした記事を書くべきだという考えに至りました。

重複コンテンツで上位表示されない際の確認方法と回避、解消方法

重複コンテンツとは

「重複コンテンツ」とは、そのページと重複するコンテンツが他に存在する状態のことを言います。Googleは、オリジナルのページを評価すると明言しています。Googleの記事もあります。

重複コンテンツは、以下の2種類に分けて考えた方が良いでしょう。

  1. 外部重複:サイト外で内容が重複したページが公開されている
  2. 内部重複:サイト内で他に内容が重複したページがあり、公開されている

重複コンテンツだとどうなるのか、ペナルティについて

上位に表示されない

重複コンテンツであるとGoogleに認識されると、後から掲載された方のページは検索結果の上位に表示されません。

同じサイトの他のページは上位に表示されるのに、なぜか特定のページだけ上位に表示されない場合や、サイト全体として、不自然に評価が低い場合には重複コンテンツを疑ってみましょう。

ペナルティが与えられる

外部重複、サイト外との重複がひどい状態だと、ペナルティが与えられる可能性もあります。

重複コンテンツでのペナルティは、手動ペナルティではなく自動ペナルティで与えられるため、サイト運営者が気づきにくいという問題もあります。

ペナルティが与えられると、サイト全体の評価が下げられます。

ペナルティが与えられてない状態では、他のサイトと重複しているページのみ評価が下げられますが、ペナルティが与えられると、重複しているわけではないページの評価まで下げられるという違いです。具体的には、トップページさえ、上位に表示されにくくなるということです。

ただ、ペナルティが与えられても指名検索(会社名などでの検索)では1位に表示されるため、やはりペナルティが与えられているかどうかは気づきにくいのです。

評価の分散が起こる

内部重複、サイト内で重複している場合にはペナルティが与えられることはありませんし、自サイトなので、そのページが上位に表示されなくても別に構わない、というケースもあるでしょう。ただ、完全に重複しているわけでもなく、それぞれに多少違う場合に、本来なら1つのページが高い評価を受けられるはずのところ、評価が各ページに分散してしまう、ということが起こり得ます。

重複コンテンツはどうして評価されないのか

他のサイトを参考にする、というのは当たり前と言えば当たり前の行為です。ただ、真似るのはよくありませんよね?コピーしてしまうのはそもそも、著作権の問題です。

そのことがまずありますが、ユーザー(サイト閲覧者)のことを考えてみてください。知りたいことを検索して調べて、上位に表示されるページが似たようなものだと、いくつか見ても徒労に終わりますよね?

ちなみに私は技術的なことをよく調べますが、いまだに、同じような情報ばかり出てきて徒労に終わることはよくあります。調べても調べても、バグが含まれる同じコードばかりが出てくるなど。1サイトだけそういうページが上位にあるぐらいなら、別にいいんですよ、私も気にしません。でも、いくら探しても同じバグが含まれる同じコードばかり出てくる、というのは疲れます。そして、意外に2~3ページ目に良い情報が載っていたりします。

そういうことができるだけ起こらないように、ということをGoogleは考えているわけです。現状でもこのような状態なので、まだまだ厳しくなると考えた方が良いと思います。

※この記事を書いた後にあたる2022年8月、Googleは重複コンテンツに対する取り締まり強化を発表しています。

また、同一人物(同一企業)が上位を独占する、ということをしにくくする、という意図もあると思っています。それぞれのサイトの内容が異なるのであればよいのですが、同じようなサイトで上位を独占されると、ユーザーも困りますし、競争原理に反します。仮に、それがまかり通った状態を考えてみてください。大手にはどこもかなわなくなります。

どのくらい似ていると重複コンテンツとみなされるのか

重複コンテンツが評価されないというのは以前からなのですが、経験的に、どんどん厳しくなっているのが手に取るように分かります。「厳しくなっている」というよりも「Googleの判断の正確さが増している」と言うのが正しいかもしれません。

私はこのサイトを使って常に実験をしています。企業秘密としたい部分もあるので、どことは言いませんが、このサイトにはページ同士で大量に重複しているページがあります。気になる方は探してみていただいても結構です。

公開した直後、各ページが、とある検索キーワードの組み合わせで上位に表示されました。しかし、しばらくしたらほとんどが上位に表示されなくなりました。

ただ、似たようなことをしている複数のサイトで、いまだに各ページが上位に表示されているのを私は知っています。それぞれのページはタイトル以外、ほとんど重複しています。

どうして、そのサイトは重複しているページでも上位に表示されるのでしょうか?答えは私にもわかりませんが、推測できることとしては、

  1. Googleアルゴリズムの正確さが増す前に評価されたページとそうでないページで結果が異なる
  2. サイト全体の評価の違い
  3. EAT(専門性、権威性、信頼性)の違い

などが考えられます。

別業種でも、重複コンテンツなのに上位に表示されているサイトの事例は知っていまして、おそらく理由は1「公開された時期の違い」だろうと私は思っています。ここ数年の間に公開されたサイトで、重複コンテンツと思われる内容で上位に表示されている事例を知らないからです。

Googleのコアアルゴリズムアップデートで、それまで上位だったページが突然圏外に消える、という事象は起こり得ます。例えば「医療・健康アップデート」と呼ばれる2017年12月に日本向けに行われたアップデートなどが有名です。

現在上位に表示されている重複コンテンツも、突然表示されなくなるようなアップデートがいつ行われてもおかしくないと私は思っています。

重複コンテンツとなってしまっている具体例

外部重複|コピーしてできたような似たようなサイトを持ってしまっている

意図せず古いサイトを残してしまっているケースであっても後から掲載したサイトは順位が上がりません。このケースは結構あると思います。

不動産会社で、サイトAとサイトBで大量に掲載物件が重複している、というようなのも後から掲載した方のサイトの評価が下がります。それもユーザーにとって迷惑ですからね。

外部重複|他のサイトのコンテンツを真似ている

記事などで上位表示を狙う場合、まずターゲットキーワードを使って検索してみて、上位に表示されているページを参考にするというのは鉄則とも言えます。

ただ、参考にしているだけなら大丈夫ですが、そのままコピーするのはもちろん論外、類似度が上がるほど重複コンテンツとしてみなされるリスクは高まります。そのロジックは、

  1. 同じページ同士で比較したときの重複具合
  2. 同じサイトで複数ページ同士で比較したときの重複具合
  3. 複数サイトに対しての重複具合

など見る観点は色々あると思います。普通に考えて、3→1の順にリスクは高いと考えられます。

特に見出し(h1~h6)の中身、構成の類似具合などは注意した方が良いと思いますが、そこだけでもないでしょう。GoogleはもちろんAI使ってます。人の目で見て、似ているなと思うページは、似ていると判断できるはずです。同じ画像を使っているか、というのも見られている可能性は高いです。Googleは画像処理で類似画像を検索する機能を持っています。

内部重複|システムで自動的に似たようなページが作られている

例えば、検索結果画面で1ページ目、2ページ目、3ページ目、という具合に表示されるページング機能を持った各ページは、タイトル含め似た形になります。

店舗を多く持つ大手が、各店舗を紹介するページを簡単に作れるようにしている場合なども、それぞれの店舗独自の情報を載せるようにしなければ、重複しやすい例と言えるでしょう。

重複コンテンツのチェック方法、調べ方、判断方法

タイトル(h1の値)をそのままで検索してみる

何故か上位に上がらないなと思っているページがあれば、そのページについてh1の値(文言)をそのままコピーして、Google検索で検索してみます。それでそのページが圏外になるようであれば、重複コンテンツとみなされている可能性が高いと思います。

「いや、他のサイトと同じタイトルなので・・」という反応が少し目に浮かびましたが、それ、重複コンテンツですから!分かった段階で変えましょう!

類似度チェックツールを使う

他のページとの類似度をチェックするツールがあります。
CopyContentDetectorは特定のページを指定せずとも、チェックしたいページを指定するだけで、どこかのページと類似してないかをチェックすることができて便利です。

ただおそらくこの類のツールはコピペをしている文章が多いかどうかの判定しかできず、それよりも現在のGoogleの重複コンテンツチェックの度合いは厳しいので、例えばライターに外注した場合にコピペで終わらせてないかのチェックぐらいにしか使えないと思った方が良いと思います。Googleは、内容として既に他のページの存在している内容しかなければ評価を上げてくれません。

コンテンツ制作者に問う

参考にしたサイトがあるか、どの程度似せたか、コンテンツ制作者に確認しましょう。そして、それぞれのサイトを目視で確認してみましょう。

重複コンテンツの解消方法、回避方法

独自性を持たせる

まず何よりも、独自性のある内容にすることです。基本的に、他のサイトにすでに載っている情報を別のサイトで別の記事かのようにして掲載することに大義はありません。自サイトが多くの人に見られていて、他の記事を見るついでに、この記事も見てもらいたいというのは気持ちとしては分かりますが、それであれば見てもらいたい記事へのリンクを張って終わりにするべきです。

独自性を持たせるには、以下のようなことがポイントだと思います。

  • 自分の考えや考察が書かれている
  • 自分なりの検証結果が書かれている
  • 他のサイトでは参考にしてないような内容を参照している(そこへのリンクを張っている)

自社で似たような複数のサイトをもっている、という場合は重複しない内容にしていく以外に道はありません。不動産会社で複数のサイトに同じ物件を掲載してしまっている場合は、それぞれのサイトで掲載する物件の種類を明確に分けるべきです。それができないなら一方のサイトは閉鎖すべきです。

仲介会社で、他社と掲載物件が大量に重複している、というのはよくあることだと思いますが、掲載している文章まで一緒でなければ重複コンテンツ扱いにはなりません。掲載元が同一なのか別なのか、掲載目的が何なのかをGoogleが見ているからだと思います。

他のサイトを見ながら書くのをやめて、自分の言葉を使う

答えが決まっているものに対して、同じ内容が書かれてもおかしくはありません。ただ、他のサイトを見ながら書いた内容と、そうでない内容は、類似度が違ってくるはずです。

自分の言葉を使って、一通り書くようにしましょう。

他のサイトを参考にする場合は、複数のサイトを参考にする

1つだけのサイトを参考にして書くよりも、複数のサイトを参考にして書いた内容の方が、特定のサイトに対しての類似度が下がりますよね?

タイトル、見出しの中身、構成の違いを意識する

上述した通り、h1~h6の見出しは、やはり文章の骨格ですから、そこが似ていると似ているように見えますよね。AIも、そう判断する可能性が高いでしょうから、できるだけそこは、あえて変えるくらいの考えで確認するようにしましょう。

自サイト内の重複はcanonicalタグを使う

自サイト内で重複コンテンツがある場合、評価を分散させないためにcanonicalタグを使う方法があります。以下のような記述です。

<link rel="canonical" href="正規URL">

canonialタグは、正規のページが他にある場合に、そのページを宣言するためのものです。

一度URLを変えてみる

重複コンテンツとして扱われてしまったページについて、リライトして重複を解消できたと思ったとき、どのくらい効果があるかはわかりませんが、一度URLを変えてみると新しいページとして評価されるので、重複コンテンツ扱いから解消されやすい感じがしています。

なお、全く内容を変えずにこれを実施しても結果は変わらないでしょうし、悪質行為とみなされるリスクがあるので(と言いますか、悪質行為なので)やめておきましょう。

まとめ

不思議と上位に上がらない、という場合に多い重複コンテンツについて、解説しました。その状態からの回復は、重複している内容を削るか、独自性を持たせたリライティング以外には道はなく、後者は時間はかかりますので、まずは重複コンテンツとなることをできるだけ避けるということを意識するようにしましょう!

著者のイメージ画像

BringFlower|稲田 高洋

2003年から大手総合電機メーカーでUXデザインプロセスの研究、実践。UXデザイン専門家の育成プログラム開発。SEOにおいても重要なW3Cが定めるWeb標準仕様策定にウェブアクセシビリティの専門家として関わる。2010~2018年に人間中心設計専門家を保有。その後、不動産会社向けにSaaSを提供する企業の事業開発部で複数サービスを企画、ローンチ。CMSを提供し1000以上のサイトを分析。顧客サポート、サイト運営にも関わる。2022年3月にBringFlowerを開業し、SEOコンサル、デザイン、ウェブ制作を一手に受ける。グッドデザイン賞4件、ドイツユニバーサルデザイン賞2件、米国IDEA賞1件の受賞歴あり。