今日はどの位のページが見られたかな??とサイトのアクセス数を見るのは記事を追加したり更新したりする上で大切な目安であり、何よりサイト維持のモチベーションアップに貢献していると思います。
そんな中困るのがスパム行為(迷惑行為)、特に外のサイトから自分のサイトに貼られたリンク経由でアクセスされたのを知る「リファラアクセス」に対して不正な情報を放り込む行為が多いと思います。これはリファラスパムと一般的に呼ばれています。
「今日はアクセスが異常に多いなぁ・・・ひょっとしてバズッた?」と喜んでいるとほとんどがリファラスパムだったなんてこともあります。
本当に困った行為です。また、この行為によってその他のデータ(ページビュー数とか表示速度などのデータ)も狂いが生じて解析どころではなくなる場合もありますね。
最近このサイトに来るリファラスパムの代表格は
- nubuilderist.info
- auto-seo-service.org
- nubuilderify.info
など。地域を見るとおフランスとブラジルあたりからのアクセスのようです。
このサイトに送られてくる大量のリファラスパム対策を備忘録として紹介したいと思います。対策についてはケースバイケースだと思いますので方法の1つとして読んでいただければ幸いです。
この手のリファラスパムはアクセス拒否しても無駄??
スパムと思われるリファラはアクセス元を調べて.htaccessでアクセス拒否すれば・・・この方法は無駄だということが分かりました。
というのもこれは不正アクセスというものではなく、Google Analyticsの不具合?機能?問題?をついたものだったからです。簡単に言うと、Google Analyticsのリファラーアクセスとして認識されればいい!!という手法が使われています。
この手のスパムには特徴があります。それは存在しないページへリファラ経由でアクセスしていることです。まあよほど暇な人でないと見てないとは思いますが、リアルタイムでのアクセスを見ていると判別できます。また、存在しないページへのアクセスなので404ページへアクセスされた履歴などでも確認できるでしょう。
前述したようにGoogle Analyticsのレポートを見た人が「あれ?どこからのリンク経由アクセスだろう??」とそのサイトを開いてくれることが目的なのですから、ページの存在なんか関係ないのです。さらに存在しないページへアクセスするのは理由があります。それは「リファラ」のレポートに表示されないことです。
WordPressで管理画面から簡単にGoogle Analyticsのレポートが見れるプラグイン
ではリファラとして表示されるのに、実際のGoogle Analyticsレポートでは表示されない・・・のはこれが原因です。
そしていろいろな場所(IP)からそのドメインに成りすましてGoogle Analytics上にだけ表示されるので、この手のリファラスパムはアクセス拒否しても無駄なのです。
どの位のスパムアクセスがあるのかを確認しよう
とはいっても、この手のリファラスパムがどの位あるのかというのを把握する必要がありますよね?スパムじゃないのに除外しても仕方ない話ですし・・・。
前の項でざっと説明しましたが、Google Analyticsのレポート上にリファラ経由でアクセスしたよ!を表示するのが目的のスパム行為(迷惑行為)なので、実際には実在するページへのアクセスはされていませんから、通常見るサイト運営者の参照URLなどで見ても何も表示されません。これがこのスパム行為のいやらしいところです。
ではどうやって発見するのか??の方法を1つ紹介します。
アナリティクスの管理画面から「ユーザー」→「地域」→「地域」を選択します
ずらっとアクセスされた国が出てきますので、怪しいと思われる国(例:フランス)をクリックします
「セカンダリディメンション」→「集客」→「参照元」を選択します
すると↓図のように地域は違うのに同じホスト(ドメイン)からのアクセスがありますね。これ不思議ですよね?だってドメインはどこかのサーバーに割り当てられてるはずですから・・・。とするとこれが怪しいということになります。
ちなみにこの図だと「auto-seo-service.org」というのが怪しさMAXです。
図はフランスだけですけど他の国からも同じドメインからのなんちゃって?アクセスがあります。もうスパム確定ですね!
ではこれらをどうやって??をこれから紹介していきますね。
存在しないページへアクセスしてくるGoogle Analyticsのリファラスパム対策
対策と言っても前述した通り実際にアクセスしていないわけですから、.htaccessなどでアクセス拒否をしても無駄なんです。つまり、排除できるものではありませんので、アクセス結果レポートを作るためのネタから除外していくというのが正確な対策となります。
先ほどスパム特定した一覧の「地域欄」に表示されている地域名をコピーします
Google Analyticsの設定画面からフィルタの追加をクリックして以下のように設定していきます
- タイトルは適当にします(先ほどコピーした地域名でいいでしょう)
- フィルタの種類は「カスタム」にします
- フィルタフィールドを「地域」にします
- フィルタパターンへ先ほどコピーした地域名を貼り付けます
- 使用可能なビューの中で適用するビューを選択して右へ移動します
- 保存します
これでその地域からのアクセスはGoogle Analyticsのレポートから除外されます。
「それじゃぁその地域からのアクセスはすべて計測されなくなるじゃん」と思った方、正解です!!
でも、もともと日本語で作っているサイトに海外からアクセスされるのって希(外国に住んでる日本人が見る程度)なので、私の場合はですけどスパムを防ぐ(計算に入れない)のが先決!!でこういう設定にしました。
これにより、いやらしいリファラスパムはなくなりますが、前述した通りいろいろな地域からなんちゃってアクセスしてくるので都度フィルタの追加をしていくことになりますから、あまり気にしないという方は最初から取り組む必要はないかと思います。
おまけ 実際のアクセス数(ページビュー数)とどの位乖離するのかを知る方法
アクセス解析などというものには100%正確なデータというのは存在しません。Google Analyticsのデータも然りだと思います。ただなるべく正しいデータを!!ということであれば同じGoogleのサービスを使って何となく確認する方法はあります。
それは、Google Adsenseのレポートと比較することです。
Adsenseのレポートではページに広告が表示された回数が表示されます。つまりページごとに1つだけ貼り付けた広告コードの表示数とAnalyticsのページビュー数が近似値であればある程度正確だということが言えるかと思います。
どちらもそれぞれの計測方法に従って計測した数なので本当に本当に正確なデータではありませんから、目安としてとらえるといいでしょう。