ECサイトを運用している中で、GoogleアナリティクスやGoogleタグマネージャを導入されている店舗も多いと思います。
GoogleアナリティクスやGoogleタグマネージャを使用している中で、
「正規表現」という言葉を目にしたことがあると思いますが、正規表現って何?と一度は疑問に思ったことがある人も多いのではないでしょうか?
例えば、「URLの先頭がAから始まり、末尾がBで終わるときにタグを発火するが、Cが含まれている場合はタグを発火させない」など複雑なルールを表現するときに便利に活用できます。
また、Googleアナリティクスのフィルタリング機能を使うことによって、特定のデータを簡単に抽出し分析する事もできますので、計測する幅が広がります。
そこで今回は「正規表現」の基本的な使い方をご紹介していきたいと思います。
正規表現とは
特殊文字を使い、文字列【1】のパターンを表現することです。
様々な文字列を少なくまとめることができるので、煩雑な条件設定も手軽に行うことができるようになります。
また、正規表現では特殊文字を『メタ文字』【2】呼んでいます。
GoogleアナリティクスやGoogleタグマネージャでは、レポートの作成やタグの条件などの設定の際に、
正規表現を活用することができます。
【1】文字列とは
単語や文章のような、文字の連なったものを『文字列』といいます。
例えば、「あ」「い」これは、文字となります。
「あい」のように文字を複数集めたものが『文字列』です。
【2】メタ文字とは
特殊な意味や機能をもつ文字の事で、プログラムで特別な意味を持たせた文字のことを言います。
正規表現一覧
基本的なメタ文字
記号 | 意味 | 正規表現の例 | マッチ例 |
. | 任意の1文字 | . | A あ |
^ | 行の先頭 | ^ECサイト運用 | ECサイト運用… |
$ | 行の末尾 | ECサイト運用$ | …ECサイト運用 |
A|B | 「|」の左右の文字列のいずれか(A, Bのいずれか) | EC(サイト|運用) | ECサイト EC運用 |
\● | 直後のメタ文字●をエスケープする | ec\.html | ec.html |
[●●●] | カッコ内に指定した文字のうち、いずれかの一文字 | [abc] | a、b、c |
[●-●] | 文字クラス内のハイフンは、文字の文字コード上の範囲を指定できる | [a-c] | a、b、c |
[^●] | カッコ内で指定した文字以外のいずれかの一文字 | [^abc] | a、b、c以外の文字 |
繰り返し系メタ文字
記号 | 意味 | 正規表現の例 | マッチ例 |
* | 直前のパターンの0回以上連続 | abc* | ab abc abccccc |
+ | 直前のパターンの1回以上連続 | abc+ | abc abccccc |
? | 直前のパターンの0回か1回の出現 | abc? | ab abc |
{●} | 直前の文字の桁数を指定。 | abc{3} | abccc |
{●,} | 直前のパターンの●回以上の連続 | a{3,} | aaa aaaa… |
{min,max} | 直前の文字の最小桁数と最大桁数を指定 | a{3,4} | aaa aaaa |
位置系メタ文字
記号 | 意味 | 正規表現の例 | マッチ例 | ¥b | 単語”の先頭、あるいは末尾にマッチ。/td> | ¥bball¥b | ball ※単語の区切りにマッチするのでbaseballにはマッチしません。 |
¥B | 単語”の先頭、あるいは末尾以外にマッチ | ¥Bball¥B | baseball |
正規表現の使い方
任意の文字列
記号 | 意味 |
.* | 任意の文字列 |
半角の『.*』を使用すると、任意の文字列を表現することができます。
正規表現 | 弊社は.*しています。 |
検索できる文字の例 | 弊社はECサイト運営に特化しています。
弊社はECサイト運用代行をしています。 |
赤文字の部分が任意の文字になります。
「検索できる文字列の例」のすべてが検索できます。
しかし、WebサイトやECサイト内で「.」を使用することが多いと思います。
例えば・・・「test.html」を検索したい場合、
正規表現 | test\.html |
検索できる文字の例 | test.html |
「.」の前に「\」を付けることで、「.」を文字として表現できます。
「●●で始まる文字列」「●●で終わる文字列」を表現する場合
記号 | 意味 |
^ | 行の先頭(●●で始まる文字列) |
$ | 行の末尾(●●で終わる文字列) |
行の先頭や最後の文字列を検索したい場合に活用します。
①弊社はECサイト運用代行を行っています。
②ECサイト運用代行
③売れるECサイト
正規表現 | ^ECサイト |
半角の ^ は、行の先頭を意味しますので、合致するのは②のみになります。
正規表現 | ECサイト$ |
半角の $ は、行の末尾(おわり)を意味しますので、合致するのは③のみになります。
正規表現 | ^ECサイト$ |
とすると、「ECサイト」の文字だけのある行に合致しますので、①②③全てが対象となります。
●か●のいずれかを表す文字列
記号 | 意味 |
A|B | AかBのいずれか |
「|」で区切られた文字列のいずれかが存在した場合に、正規表現に合致します。
正規表現 | ECサイト運営|ネットショップ販売代行|EC制作会社|ECサイト構築 |
検索できる文字の例 | ECサイト運営 ネットショップ販売代行 EC制作会社 ECサイト構築 |
まとめ
正規表現について基本的な使い方をご紹介しましたが、
GoogleアナリティクスやGoogleタグマネージャーで正規表現を活用すれば、
レポートの作成やタグの条件に設定できますので、より計測する上で便利に活用できると思います。
現在行っているECサイト運用などの幅も広がると思いますので、
正規表現をしっかり理解して、今後の運用に役立てていきましょう。
Written by Baycross Marketing