Googleアナリティクスで使う正規表現とは?一覧や使用例を紹介
Googleアナリティクスでアクセス解析に取り組むなかで、標準的なレポートでは確認できないデータを分析したいと考える方も多いのではないでしょうか。正規表現と呼ばれる方法を使えば、より柔軟な条件でGoogleアナリティクスのデータを確認することが可能です。
この記事では、Googleアナリティクスの正規表現に関する基礎知識や、使用できる正規表現の一覧、正規表現の具体的な使用例について解説します。GoogleアナリティクスをWebサイトの運営に役立てたいWeb担当者の方はぜひ参考にしてください。
1.Googleアナリティクスの正規表現とは?
正規表現とは、「メタ文字」と呼ばれる特殊文字を使うことにより、特定の条件にあてはまるターゲット文字列を検索したり、置換したりする方法です。
Googleアナリティクスで正規表現を使用すると、管理画面のセグメント機能やビューフィルタなどで、特定の文字列を含むURLやIPアドレスだけを指定してデータ分析ができます。
Googleアナリティクスに標準装備してあるフィルタ機能では、大まかな条件しか指定できません。正規表現で条件を指定することで、自社サイトの構造やアクセス元のIPアドレスにあわせて、より複雑な条件設定ができます。
2.Googleアナリティクスで使う正規表現の一覧
Googleアナリティクスで使用できる正規表現は、「ワイルドカード」「アンカー」「グループ」「エスケープ文字」の4種類です。以下では、各正規表現の意味について解説します。
ワイルドカード | 条件に一致する文字・数字・記号の出現回数などを指定できます。 |
---|---|
アンカー | 文の先頭や末尾など、文字列が置かれている場所を指定できます。 |
グループ | 複数の文字をグループとしてまとめて扱い、グループに含まれる要素の順番を指定できます。 |
エスケープ文字 | 正規表現のメタ文字と通常文字列を区別するために使用します。 |
ここでは、Googleアナリティクスで使用する正規表現におけるメタ文字の意味について紹介します。
2-1.ワイルドカード:「.」
「.」は、文字や数字、記号などを検索できるメタ文字です。「.」1つにつき、任意の1文字として扱うことができます。
たとえば、正規表現で「123.」と入力した場合、「123あ」や「1234」、「123@」などと一致させることが可能です。文字の種類を問わず指定できる汎用性の高さが特徴となっています。
2-2.ワイルドカード:「?」
「?」は、直前にある文字が0回または1回出現する箇所を検索できるメタ文字です。
たとえば、正規表現で「123?」と入力した場合、「12」または「123」が検索できます。「?」の直前にある文字の種類は任意であるため、「あいうえお?」や「info?」などの指定も可能です。
「?」は、ハイフンやアンダーバーなどの直後に置き、記号の有無にかかわらず一致させたいときなどに役立ちます。
2-3.ワイルドカード:「+」
「+」は、直前にある文字が1回以上繰り返し出現する箇所を検索できるメタ文字です。
たとえば、正規表現で「123+」と入力した場合、「123」や「1233」などが検索できます。直前の文字が1回以上出現することが条件であるため、「125」や「12a」などの文字列は検索されません。
「+」は「?」と同様に、直前にある文字の種類を問わず使用できます。
2-4.ワイルドカード:「*」
「*」は、直前にある文字が0回以上繰り返し出現する箇所を検索できるメタ文字です。
たとえば、正規表現で「123*」と入力した場合、「12」や「123」、「1233」などが検索できます。「*」の直前にある文字の種類は問われません。
2-5.ワイルドカード:「|」
「|」は、前後にある文字列のいずれかにあてはまる箇所を検索できるメタ文字です。「|」を使うことで、or条件による検索ができます。
たとえば、正規表現で「organic|cpc」と入力した場合、「organic」と「cpc」の両方を検索することが可能です。
「|」はGoogleアナリティクスで、複数条件のいずれかにあてはまるデータを抽出する際に役立ちます。
2-6.アンカー:「^」
「^」は、直後にある文字列が文の先頭に位置する箇所を検索できるメタ文字です。正規表現で入力する文字列の最初に置いて使用します。
たとえば、正規表現で「^123」と入力した場合、「123」や「12345」などを検索することが可能です。「12」だけの場合や、「0123」などは、「123」が先頭にない文字列であるため検索できません。
2-7.アンカー:「$」
「$」は、直後にある文字列が文の末尾に位置する箇所を検索できるメタ文字です。「^」と同様に、正規表現で入力する文字列の最初で使用します。
たとえば、正規表現で「$123」と入力した場合、「123」や「0123」、「あいうえお123」などを検索することが可能です。「01234」や「123あ」などは「123」が末尾にない文字列であるため、検索できません。
2-8.グループ:「()」
「()」は、囲んだ文字列が順番通りに一致する箇所を検索したり、ほかの正規表現をまとめてグループ化したりできるメタ文字です。
たとえば、正規表現で「(123)」と入力した場合、「123」や「012345」などを検索することが可能です。「321」や「1a23」などは、「123」がこの順番で登場しない文字列のため検索できません。
また、ほかの正規表現と組み合わせて「123(a|b)」と入力した場合、「|」の対象範囲が「()」内に限定されるため、「123a」または「123b」のいずれかが検索できます。
2-9.グループ:「[]」
「[]」は、囲んだ文字列が順序を問わず一致する箇所を検索できるメタ文字です。
たとえば、正規表現で「[123]」と入力した場合、「123」や「321」、「1A32」などが検索できます。「[]」は、ほかの正規表現と組み合わせて使用することも可能です。
2-10.グループ:「-」
「-」は、「[]」に含まれる文字の範囲を表現するためのメタ文字です。
たとえば、正規表現で「[1-5]」と入力した場合、1から5までのすべての数字が含まれた文字列を検索できます。「[a-z]」と入力することで、アルファベットの小文字をすべて検索の対象にすることが可能です。
すべての半角数字またはアルファベットの小文字を表す正規表現として、「([0-9]|[a-z])」が用いられます。
2-11.エスケープ文字:「¥」
「¥」は、正規表現でメタ文字として扱われている文字の直前に置き、通常の文字として扱うためのメタ文字です。
たとえば、正規表現で「123¥.456¥.789」と入力した場合、「123.456.789」を含む文字列が検索されます。「¥」の直後にある「.」は通常の半角文字扱いとなり、ワイルドカードのメタ文字としては扱いません。
3.【ケース別】Googleアナリティクスにおける正規表現の使用例
Googleアナリティクスで使用できる正規表現を使いこなすためには、実際に使ってみることが大切です。Googleアナリティクスの管理画面に正規表現を入力し、結果を確認することで、活用方法が身に付きます。
Googleアナリティクスにおける正規表現の使い方は以下の通りです。
3-1.抽出したいデータを絞り込む
Googleアナリティクスの情報を、ランディングページごとや参照元/メディアごとに絞り込む場合、検索窓やフィルタの設定で正規表現が使えます。
たとえば、ランディングページのURLに「info」または「service」のいずれかが含まれるデータを絞り込む方法は以下の通りです。
- (1)Googleアナリティクスでランディングページごとのレポート画面を開く
- (2)検索窓に正規表現を使った文字列「info|service」を入力
- (3)検索窓の横にある虫眼鏡のアイコンを選択
上記の例で挙げた「info」や「service」などの検索文字列は、自社のランディングページに含まれる実際の文字列に置き換えて試しましょう。
3-2.IPアドレスを除外する
「自社からのアクセスを除外したい」など、特定の範囲に含まれるIPアドレスからのアクセスを除外したい場合の手順は以下の通りです。
- (1)Googleアナリティクスの「アナリティクス設定」から「フィルタを追加」を選択
- (2)フィルタの種類を「カスタム」に設定し、「除外」を選択、フィールドに「IPアドレス」を指定
- (3)フィルタパターンに正規表現を入力して適用
たとえば、「149.254.1.」で始まり、末尾が「0」~「254」までのIPアドレスを除外設定したい場合は、以下の正規表現を使用しましょう。
^149¥.254¥.1¥.([0-9]|[1-9][0-9]|1([0-9][0-9])|2([0-4][0-9]|5[0-4]))$
[()]で囲まれて「|」で区切られている箇所は、1桁~3桁からなるいずれかの数値を表します。
「[0-9]|」の部分は、IPアドレスの最後が1桁で0~9までの場合を指定する正規表現です。次の「|[1-9][0-9]|」は、2桁で10~99を表します。
[1-9][0-9]|の隣にある「1([0-9][0-9])」は、3桁で100~199を表す正規表現です。最後の「2([0-4][0-9]|5[0-4])」は3桁で200~249と、250~254を意味しています。
正規表現で複雑な処理内容を指定する場合は、パーツごとの正規表現に着目することで意味を簡単に理解できます。
まとめ
Googleアナリティクスでは、正規表現と呼ばれる記述方法によって、さまざまな条件に合致するデータを絞り込むことが可能です。
正規表現には、「ワイルドカード」「アンカー」「グループ」「エスケープ文字」など、機能が異なる文字列が含まれます。文字列の機能を理解し、正しく組み合わせることが正規表現を使いこなすポイントです。
Googleアナリティクスで調べたいデータを抽出したり、特定のIPアドレスからアクセスされたデータを除外したりしたい場合は、ぜひ正規表現を活用してみてはいかがでしょうか。
KEYWORD