読者です 読者をやめる 読者になる 読者になる

Life is colourful.

Inspire yourself

最近PV増えた!?それスパムかも。アナリティクスのフィルターとセグメントによるリファラースパム対策

ブログ運営 Web制作

f:id:mtasam:20160607082816j:plain

Google Analyticsを使って11月のアクセス集計していると、今までよりPVが増えている人多いかもしれませんね。

よくみるとGoogleやLifehackerからのトラフィックもある!? 

 

自分の管理サイトからそういうアクセスデータがあがってきている人、要注意です。そのデータ、スパムで水増しされています。

面倒くさいけどスパム対策しましょう

11月のアクセスデータ、スパム汚染されてい人多いと思います。

僕もこのブログ含め仕事でもいくつかサイト管理してますが、今月全てのサイトでスパムを確認しています。同様に被害にあっている方も多いと想像できます。

 

アナリティクスのデータがスパムに汚染されていると、正しいアクセス解析が出来ませんので、PVが増えているように見えてもそれはぬか喜びです。

アクセス解析する前にきちんと除去しておきましょう。

 

この記事では、リファラースパム対策について書きます。
対策方法は2つあり、どちらもGoogle Analyticsの機能を使います。

  • フィルタによる対策
  • セグメントによる対策

 

どちらも条件を設定して特定のデータを抽出する手段です。これをスパム除外に使います。メリット・デメリットを述べつつ、両方の使い方を紹介していきたいと思います。

まずは、すでに外でも記事が出ていますが、最近急増しているリファラースパムの話から入っていきましょう。

 

 

ɢoogle.comとlifehacĸer.comはリファラースパム

11月以降、アナリティクスの画面でこういう表示を目にしている人は多いでしょう。

f:id:mtasam:20161201175737j:plain

 

赤枠の部分です。こう書いてあります。

Secret.ɢoogle.com You are invited! Enter only with this ticket URL. Copy it. Vote for Trump!

言語設定が「ɢoogle.com...」?Vote for Trump!(トランプに投票しよう)??

 

明らかに変ですね。 

まだ気づいていないという人でも、汚染されている可能性はあるのでアナリティクスをチェックしてみて下さい。[ユーザー]-[サマリー]を確認して下さい。

 

これはロシア方面から飛んできているリファラースパムという悪質なアクセスです。よく見るとGoogleではなくɢoogleです。Gが変ですね。

 

気になりますね。でも間違ってもこのサイトにアクセスしてはいけません。「お、なんだこのアクセス?どっから来てるんだろう?」そう思わせて誘導するのが、リファラースパムの目的ですから。

 

同じく、参照元が「lifehacĸer.com」のアクセスがここ最近急増しています。これも言語設定が上のɢoogleスパムと同じです。(参照元というのは、要するにリンク元ということです。)

 

ライフハッカー??超有名なサイトですね。自分のサイトのリンクが貼られてる!?

 

こちらは、[集客]-[すべてのトラフィック]-[参照サイト]で確認できるでしょう。こういう表示があれば、スパム被害受けてます。

f:id:mtasam:20161201202726j:plain

ほとんどの人はlifehacker.comからリンクを貰う心当たりがないと思います。(lifehacker.jpなら可能性はありますが)

こちらも、lifehacker.comではなくlifehacĸer.com。今度はkがやや潰れています。

 

どちらも発信源は同じです。ロシア。
11月になって急に増えたスパムで、かなりのアクセス数ですので、誤差の範囲で収まっていない人も多いと思います。

11月PV増えたー!と思っている人は、まずスパム対策してから正しいデータを集計してみましょう。

アナリティクスの「フィルター」を使ってみます。

 

ɢoogle.com、lifehacĸer.comスパムをフィルターで除外する

最近急増のスパムは、言語に「ɢoogle.com...」が設定されているのが特徴です。普通は言語設定は、日本語なら「ja-jp」、英語なら「en-us」とかです。

なのでとりあえずは、言語設定でフィルターをかけて除外する手段を考えましょう。

 

フィルター設定方法

まず、「管理」から「フィルタ」をクリックします。

f:id:mtasam:20161201202730j:plain

 

下のようなフィルタ管理画面になるので、「フィルタを追加」をクリック。 

f:id:mtasam:20161201202729j:plain

 

 フィルタ追加画面になったら、次の①~⑤の手順でフィルターを設定します。

f:id:mtasam:20161201202728j:plain

 

①「新しいフィルタを作成」になっていることを確認

②「フィルタ名」は何でもいいです。あとで自分がわかりやすいフィルタ名にしておきましょう。ここでは「ɢoogle.com...」の文言をそのまま入れています。

③フィルタの種類は「カスタム」をクリック

④デフォルトで「除外」が設定されていることを確認して、フィルタフィルドに「言語設定」を選んびます。フィルタパターンは以下をコピーして入力します。

Secret.ɢoogle.com You are invited! Enter only with this ticket URL. Copy it. Vote for Trump!

⑤最後に、設定したフィルタが機能するか確認します。

 

以下のような画面になれば成功です。

f:id:mtasam:20161201202727j:plain

 

これは、「このフィルタをかけるとこういうデータを除外しますよ」という確認です。すでに取得しているデータの中から対象データを発見してくれています。

上の図例では、544PVも該当しています。

 

スパムを目視で確認しているのに、ここで何も表示されなければ設定が間違っていますので、上のフィルタ設定を再確認してください。

もともと汚染されていない人は、該当するデータがありませんので何も表示されません。

 

確認したら「保存」しましょう。フィルタが機能し始めます。

これで、ɢoogle.comスパムとはおさらばです。

 

 

フィルタによるスパム除外の注意点

フィルタ設定を利用するときのデメリットが3つあります。

  1. 過去のデータのスパムを除去できない
  2. フィルタ設定を失敗すると取り返しがつかない
  3. 複数サイト管理している人は面倒

 

まず1ですが、フィルター機能は過去のデータには適用されません。つまり、すでに取得してしまったデータのスパムを取り除くことはできません。

また2つ目として、万一誤ったフィルタ設定をしてしまった場合、知らないうちに正当なデータも除外してしまう可能性があります。この場合は、除外したデータを取り戻す術がありません。

そして3つ目として、サイトをまたいでフィルタを一括設定できないので、複数サイトを管理している人は、全てのサイトに対して同じ入力をする必要があります。面倒です。

これらがフィルタの欠点です。

 

これを解消できるのが、「セグメント」によるスパム対策です。セグメントを使えば、スパムデータを永久追放ではなく「表示させない」ようにすることができます。要するに、見え方を変えるだけです。

 

 

セグメントによるリファラースパム除外

セグメントを使ったリファラースパム除去設定をする前に、もう少し汎用性のあるリファラースパム対策を考えた方が賢いです。

言語設定や参照元で特定しているとキリがありません。新種が登場する度に設定しなくていはいけません。

 

リファラースパムの特徴 

では、どうするか。
そもそも、リファラースパムとはGoogleに偽装データを送ってサイト管理者のアナリティクスデータを操作しているだけなので、実際にあなたのサイトを訪問しているわけではありません(なので、もちろん広告も踏んでもらえませんよ)

 

「あなたのサイトに来ていない」

これを利用して、スパム判定するのがよいかと思います。こうしておけば、未来のリファラースパムにも対応できます。

 

具体的にはホスト名で判定します。まともなアクセスならホスト名は自分の管理サイトのドメインになるはずです。このブログなら「lifeiscolourful.hatenablog.com」。うちのブログに訪問しているアクセスなのですから当然です。

 

ところが、リファラースパムはホスト名が(not set)だったり、いいかげんに設定したapple.com、lifehacker.comだったりします。

f:id:mtasam:20161202152146j:plain

 

セグメントの設定方法

アナリティクスでホスト名でセグメントを設定してみます。

「管理」をクリックして、「セグメント」にいきます。

f:id:mtasam:20161202165205j:plain

 

そこで「新しいセグメント」をクリックすると、下のようなセグメント設定画面に移ります。

f:id:mtasam:20161202165908j:plain

 

ここで、以下の通り入力します。

  1. セグメント名はなんでもOK。自分がわかりやすい名前がいいです。
    (ここでは、lifeiscolourful.hatenablog.com[ホスト名:完全一致]としています)
  2. 左から、「ホスト名」、「完全一致」、「自分のサイトのURL」を入力します。
  3. ③「保存」で終了です

 

これで、セグメントの設定が終わりました。

一度設定したセグメントは、管理している全てのサイトに適用可能ですので一回きりでOKです。(これがフィルターとの大きな違い)

 

きちんとスパム除去できているか、表示を見てみましょう。

いつもの画面に戻って、[ユーザー]-[サマリー]にいきます。下図のセグメントをクリック。

f:id:mtasam:20161202171528j:plain

 

先ほど設定したセグメント名を探してクリック。そして、適用をクリックします。

f:id:mtasam:20161202171529j:plain

 

すると、全てのデータが色違いの2種類で表示されるようになります。
PVのグラフも以下のように、青色とオレンジ色の2本の線で表示されます。

f:id:mtasam:20161202172256j:plain

 

青がスパム込み。オレンジがスパム除去後の正しいデータということになります。上の図では、11月後半がかなりスパムに汚染されているのがわかりますね。

 

ちなみに、元のスパム込みデータ(青色)が要らない方は、青い「すべてのユーザー」セグメントを削除すればOKです。(フィルタと違っていつでも復活可能です。)

 

これでやっと、まともなアクセス解析が始められますね。

 

最後に:アナリティクスの解析機能を使うとおもしろい

今回は、やっても何の得にはならないスパム対策をしたわけですが、もちろんアナリティクスの機能は、サイトから利益を出す方向にも使えるわけです。

今回のセグメントなんかも、少し知っていれば色んな切り口で管理サイトをみることができますし、それによって新たな改善点や自分のサイトの特長なんかにも気づくことができ、収益化の道筋が見えてきますよ。

誰かが言っていたノウハウや、なんとなくの感覚に頼ったものでなく、数値による裏づけのある自分なりのマネタイズ戦略が立てられますよ。

 

これについては、こちらで書きました。

 

 

アナリティクスの基本操作から本格的な解析手法までは、この本に書かれていますので、興味ある人は読んでみていいと思います。すごく実践的な本です。

もう少しマーケティング寄りの本ならこちらもオススメできます。

 

上の2冊含め、Webマーケティング関連の本の書評も過去記事で書いていますので、興味ある人は読んでみてください。