一生懸命作った記事の転用、最低ですね。でも実際にそんなサイトいっぱいあるんですね、これが。
実際に被害に遭われている方、転用されていることすら知らない方などなどいらっしゃることでしょう。
私が一番最近見つけたのがこのサイト
もちろんスクリーンショットだけ表示してます(こんなサイトにリンクを張ったりサイト名を紹介したりしません)。
この記事は以前に当サイトでリリースした
というプラグインの紹介記事。そのほかにも公開した記事のほとんどが盗用されていました。
このサイトの巧妙なところはトップページなどに表示されるのは元のサイトの記事へのリンクであることです。でもサイトマップというところをクリックして見ると、そこには自身のサイトの記事として掲載されている形跡がきっちり残っています。そして、さらに巧妙なのはパクッて公開している記事のタイトルや「続きを読む」リンクの先が元のサイトの記事へのリンクになっていること。こうすることで自身の記事にはしているけどきちんと元の記事へのリンクをしてますよというグレーゾーンを作っていると思われます。
ただ目視すればそういう性質であることは分かるものの、ソース上では自身の作成したページであるようになっているので、自動化された検索エンジンクローラーからすればオリジナルの記事として認識されると思われます。
こうした被害をなくすためにいろいろな対策を行ってきましたが結局はいたちごっことなりなかなか確定的な対策には至りませんでした。そんなとき、WordPressで別の機能を目的とするプラグインを活用できるのでは?ということで試した結果、簡単な方法で、しかも管理画面から管理して排除することができましたので、記事盗用の実態と防止方法を兼ねて紹介します。
なぜ記事を転用する(パクる)のか?
答えは簡単、楽して稼ぐためです。こういうサイトには必ず沢山の広告が貼ってあります。人の書いた記事を自動的に収集して表示することでアクセスを集め、そこに貼られている広告をクリックされることで収入を得る、いわゆる「不労所得」なることを実践しようとしているのです。
実際に「不労所得」などというキーワードで検索するとこの方法を情報商材として販売されているものや、この方法を提供する代わりにメールアドレスを登録してメルマガを発行しているところなどが見られます。
そもそも人の記事盗用しといて、別の商材を売ったりメールアドレスを収集してステマを仕掛けたりと絶対に許せない行為だと思います。
そんなこと書いてたら頭がますます沸騰してきました・・・ここは冷静に進めて行きますね。
記事を転用される(パクられる)仕組み
まずは敵の兵法を知らなければなりません。どうやってサイトの記事を勝手に転用しているかを知ることで対策はおのずと見えてきます。
記事の転用をする人が行うのは決して記事をいちいちコピーするなどといった人海戦術ではありません(ご存じかと・・)。従ってたくさんリリースされているコピー禁止系のプラグインでは全く効果がありません。
それどころか、全うに記事の一部を引用して紹介してくださる(これが当たり前)方にコピーさせないという失礼をしているので個人的にはあまりおすすめしません。
では敵はどうやって記事を搾取しているのか・・・それはWordPressやブログにある更新通知機能「RSSフィード」の情報をそのまま自分の記事にしてしまうという方法です。中には不正ログインをして定期的に記事を奪っていくとかデータベース情報を奪っていくなどという荒業もあるかもしれませんが、こういう輩は単純に、簡単に、手間なくやりたいわけですからそんな煩わしい方法は通常使いません。
それならRSSフィードを停めてしまえばいいのでは?と思うかもしれません。
でも、RSSフィードは大きく
- RSSフィードリーダーを使って記事の更新を通知することで定期読者を増やす
- 他サイトにRSSフィードの情報を表示することでリンククリックによるアクセスを増やす
- ブログランキングサイトからの新着記事情報の収集→ランキングサイト内のクリックからアクセスを増やす
の3つの効果をもたらします。どれもこれもアクセスアップには欠かせない有効な機能なのです。
でも記事をパクる奴らはこの中の2を悪用してリンクではなく自分の記事として盗用するのです。
結局はRSSフィードを停止してアクセスアップ効果を捨てるか、泣き寝入りするか、はたまたそのサイトへ通知して転用を止めさせるかのいずれかになります。
とはいえ、こういう輩はたいてい「バレたら止めればいい」と思っている奴らなのでこれまたいたちごっこになりますから、また同じ仕組みで別のドメインを取って行われれば永遠に続いてしまいますね。
記事が転用される仕組みは理解できましたか?それではここで1つ対策を!!
RSSフィードの記事は最小限かつ最低限にする
多分WordPressのサイトでコピー被害に遭われている方はやられているでしょうけど敢えて紹介しておきます。
それは、RSSフィードの件数を減らし、抜粋のみにすること。これで記事のまるごと盗用を防止することができます。
設定は簡単、ダッシュボードから「設定」→「表示設定」を開き
- RSS/Atom フィードで表示する最新の投稿数を2~5程度へ変更する
- RSS/Atom フィードでの各投稿の表示を「抜粋のみを表示」へ変更する
だけです。
「抜粋のみ表示」というのはテーマやプラグインなどで何も設定していなければ記事本文の先頭からおおよそ110文字程度をRSSの情報に含めるという設定で、盗用されても記事先頭から110文字程度という風にできます。ここを「全文」にしてしまっていれば簡単にすべての内容が盗用されてしまいます。
これを抜粋にしても前述したランキングサイトでは問題ありませんし、逆にRSSリーダーではタイトルと簡単な概要だけが表示されるので見る方からうっとおしがられることもありません。そもそもRSSリーダーで記事の概要を見てサイトに訪問してもらうことが目的なのですから全文を設定する必要はないのです。
投稿の表示数については一旦盗用され始めてしまえば最新記事は常に盗用されますからあまり意味がないかもしれませんがRSSフィードのアドレスにアクセスされたときの情報量を減らしてサーバーの負荷を軽減するためにも必要最低限な数にした方がいいでしょう。
記事冒頭に紹介した盗用記事の例、画像に表示されている文言とカード式で表示している記事リンクの「タイトル」「抜粋」が同じなの分かりますよね?要するにこういう形で盗用されているんです。
盗用?引用?リンクのリスト? 私が判断する基準
ひとえに記事をパクられた・・・なんていってもその姿はさまざまです。ここでは私が盗用と判断する基準を述べておきます。同時に盗用ではないパターンも書き添えます。
うなったらパクリでしょ!!という判断基準。これは1つの記事(ページ)として自分の記事がコピーされ、公開された場合です。今回この記事を書くきっかけとなったサイトがそうです。通常インターネット上で単独ページとして判断される基準は
- ヘッダー・フッターが存在すること
- htmlタグで囲まれた独立したページであること
- タイトルタグ、概要タグなど検索エンジンのインデックス登録のためのタグが存在すること
の3つ。まあ単純にそのページのソースコード全てをコピーして表示したときに、私の記事の文章と同じものが表示されることです。
従って、一部の文章をコピーする「引用」やいろいろなサイトのタイトルなどを収集してリンク表示する、いわゆる「まとめ」的なコンテンツであれば盗用とは判断していません。
要はその構造上サイトの1つのページとして存在するものが、私の書いた文章であるということを基準にしています。
よくあるキュレーション(私はこの言葉嫌い)サイトのようにただRSS情報を収集してクリックすれば必ず私のサイトにリダイレクトされるだけのサイトは単なる外部からのリンクと判断しています。この類まで拒否していたらキリがありません。
ついでに「引用」についての定義は
- 引用タグで囲まれていること
- 引用元として元記事へのリンクをしていること
です。引用タグは基本的に検索エンジンの評価からは無視されますからコピペされたとしてもオリジナルの文章とはみなされませんし、暗黙のルールではあるものの引用した記事へのリンクが張ってあるものはOKとしています。
どうでしょう?基準としてはこんな感じにしていますが、この記事を読んでいただいている方の基準はどうでしょうか?
パクられるとどんな影響が出るのか
次に記事を搾取される(パクられる)とどんな悪影響があるのかを紹介します。確定的なものと想像上のものが混在しますがご容赦ください。
- サイトの資産を奪われる
盗用ですから当然のこと。著作権侵害や知的財産権の侵害以外の何物でもありません
- 検索エンジンへのインデックス登録のタイミングによってはこちらがコピー記事として認識される可能性がある
盗用サイトはたくさんのサイトから記事を搾取してきますから当然個人で運営しているようなサイトと比べれば規模は大きくなります。規模が大きくなったりアクセス数が多くなったりすると検索エンジンクローラーも頻繁に巡回するようになりますから、オリジナルのサイトよりも速くインデックスされるという現象が起こり得るのです。そうなると後から巡回されたオリジナルサイトは・・・ということになり兼ねません。
- 関連性のないサイトからのリンクが多いことでサイトの評価が下がる可能性がある
脈略なくいろいろなサイトから収集した記事を掲載していますから、中には好ましくないジャンルの記事もあるでしょう。そんなサイトからのリンクはマイナスになること間違いなしだと思います。
というのが主だったところですね。逆に気にしない方からすれば「こういうサイトからのアクセスもある」といい材料ととらえる方もいるかもしれませんね。
多分これが一番簡単であろう WordPressでの記事盗用防止策
ここまで長いこと読んでいただきありがとうございました。やっぱりいろいろなことを知ってから対策するのとしないのとでは違うと考え概要の説明を先に行いました。
さて、ここからが本題です。あまりに簡単なのでここ以前の文章よりも短くなるかもしれません。
盗用されているサイトを発見する方法
まずはパクリサイトを特定しなければなりませんね。その方法は大きく以下の2つがあります。
- Google検索でページタイトルそのもので検索してみる
- Google Analyticsなどのアクセス解析ツールでリファラー経由でのアクセスを確認する
1の方法は一般的ですね。記事タイトルで検索をかけるとある程度絞られますから重複しているパクリサイトを発見しやすいです。ただGoogle様は関連検索に優れているのでなかなか見つからない場合も・・・そんなときは楽天やyahooといった他の検索エンジンで行うといいでしょう。自分の記事がインデックスされていればあとはパクリサイトがないかを確認するだけです。
2の方法はGoogle Analyticsの参照元レポートで確認する方法。パクリサイトがある程度アクセスがあれば、そこからのアクセスがあるはずですからね。
Google Analyticsの場合は
- レポートの左メニューから「行動」→「サイト運営者」→「サイト運営者の参照URL」を開きます
- 出てきた画面の中ほどにある「セカンダリディメンション」をクリックし「集客」→「参照URL」と選択します
これでどこのサイトからどこのページにリンク経由でのアクセスがあったかが分かります
- URLをアドレスバーにコピペして訪問してみる
サイト内を見て、自身の作成したページがあればコピペサイト確定です。この記事の下に書いてあるように証拠を残しましょう
こんな感じで特定できます。
パクリサイトからの情報収集を拒否する方法
冒頭に「パクリサイトはRSSフィード情報を搾取して掲載する」という説明をしました。・・・ということは、パクリサイトからのアクセスを単純に拒否すれば・・・というのが今回の発想です。
アクセス拒否を簡単に行うには
というプラグインがおすすめです。これを使えばWordPressの管理画面上で簡単にアクセス拒否が設定できます。
通常は不正アクセスの対策として使うプラグインですが今回はパクリサイト対策として使います。拒否されると
のような画面が表示され、アクセスできなくなります(今回とは関係ないですが・・・)。
「WP BAN」プラグインはIPアドレス、ホスト名(サイトのhttp://wwwを省いた部分)両方でアクセス拒否ができますが、大抵は同じサーバー内に複数のサイトを別ドメインで作って似たパクリサイトを作ることが多いですから、ホスト名ではなくIPアドレスで拒否する方が効果的だと思いますので今回はその方法で実践します。
先程の方法でパクリサイトを特定したら、ドメインをコピーして
などドメインからIPアドレスを知ることのできるサイトでIPアドレスの特定をします。
そしてこのIPアドレスをプラグインの設定に追記するだけ!!これで対策完了です。
あれ??これだけ??位簡単な方法です。
これにより、そのIPアドレスのサイトの内部で処理されるようなパクリツール(機能)からのアクセスは拒否できますが、外部サービスなどを通している場合には無効となってしまいますから、実際に何か投稿してみて搾取されなくなっているかを確認しましょう。
実際にテストしてみました
上の方法で実際に情報が収集されないかをテストしてみました。テスト方法は
という記事を設定後に公開してみて、そのサイトに更新情報が掲載されるのか?という簡単な方法です。
結果は・・・見事成功!!この記事を投稿した日時よりも後に公開された記事がパクられてましたから、確実に盗用は停止できたようです(あまりそのサイトにアクセスするのも嫌なので、しばらく監視した後は確認していません)。
恐らくこういうサイトを作る輩は一度サイトと機能を作ったら放置でしょうから、拒否されていることに気づくこともないでしょう。よしんば気づいたところでどうしようもないのですからね。
最終的にはGoogleへ通報
パクリサイトを作成する人の目的は前述した通り「不労所得」を得ることです。今回の方法で自分のサイトは盗用されなくなりましたが、根本解決にはなりませんよね!!
悪い輩はやっぱり成敗するしかありません。
そこで有効なのが「Google Adsense」へポリシー違反の通報をすることです。収益の根を断つのが一番です。
Google Adsenseをよく知る方なら当然ご存じのことだと思いますが、1度審査に通過すれば警告されるまではどこのサイトへ広告を掲載しても広告が配信停止されたり、アカウントが停止されたりすることはありません。つまり、こういうサイトを作成するサイトの管理者が考える「バレなければOK」なのです。
それならこちらも考えがある!!という対抗策が違反通報なのです。1人の通報では効果がないかもしれませんが、複数の方から「記事の盗用被害にあった」と報告が入れば・・・・ですね。特に自分のアカウントに影響があるわけでもないですからどんどん通報すべきだと思います。
おまけ 盗用被害に遭ったらやっておくべきこと
サイトが盗用被害に遭ったとき、日記として「こんなことがあった」と書きたくなるでしょう。でもちょっと待ってください。
盗用されたサイト名やURLなどを付けて書くのは決して悪いことではないですし、他の方への注意喚起にもなるいいことをしているには違いありません。
ただし、これを行う前に証拠を残しておく必要があります。少なくとも相手のサイトを誹謗中傷することになるわけですから当然です。
その日記をたまたま見た盗用サイトの輩が考えるのは「搾取した記事は削除してから訴え出る」という作戦です。そうなるとこちらからは何も証拠提示することができないので、まああまり事例はないとは思いますが訴えられることもあるかもしれません。
取っておくべき証拠は
- 盗用された記事のスクリーンショット
- 盗用された記事のソースコード
の2つ。スクリーンショットはデザインが変更されてしまえばおしまいなのでアドレスバーの部分も含めた形のものを保存しておくようにしましょう。
そして盗用サイトについての記事を書くときには相手といろいろやり取りするのもうっとおしいですから、【「スクリーンショット」と「ソースコード」を保存してあります】などという文言を付けておけば完璧でしょう。
どうでしたか?恐らくこれがWordPressのサイトで一番簡単に、かつ、管理しやすい盗用(パクリ)サイトの撃退法だと思われます。
最後に「こんなサイトに盗用された~」という事例があればコメント欄に書いていただければ、皆さんで確認・共有できると思いますのでよろしくお願いします。
怒りで書く記事は筆が乗ります(泣)・・・・長い記事を読んでいただきありがとうごさいました
2017年10月24日追記
あくまで私の目視での確認ですが、今回パクリサイトとして例を挙げたこのサイトは今でも存在はしています。でも以前はGoogle検索にヒットしていたものが無くなり(インデックスの削除)、サイトにあったアドセンスの広告も無くなり、指摘した裏?リンクもなくなっていました。恐らく「パクられてますよ~」と教えた複数サイトの方が働きかけてくれたんでしょう(と信じています)。