開発ブログ
Git、CSS、HTML、正規表現など、入門者がつまづきそうなポイントを中心に、役立ち情報発信します。。

正規表現:半角英字、数字、記号の表現

最終更新:2018-07-19 by Joe

正規表現における、半角文字の表現です。

半角英字文字(アルファベット)の正規表現

正規表現で特定の1文字を表すには「文字クラス」を利用するのが便利なのでした。文字クラスでは、文字コード上の範囲を明示することができますので、半角英字(アルファベット)を範囲で指定できます。

// 半角英字アルファベットの一文字
[a-zA-Z]

半角数字の正規表現

同様に、半角の数字も、文字コード上の範囲で明示する事ができます。

// 半角数字の一文字
[0-9]

また、数字は、エスケープシーケンス「\d」を利用しても表すことができましす。

// 半角数字の一文字
\d

半角記号の正規表現

記号も同様です。ASCII文字コードがよくわかないので調べます。

上記のリンクから、ASCIIコード上、「半角スペース(32)」で開始し、「スラッシュ(46)」で終わる記号群と、「コロン(58)」で始まり。「@(64)」で終わる記号の範囲があるようです。また、終盤に、「[ (123)」や、「 ~ (126)」もあります。これをそのまま記述しましょう。

// 半角記号の正規表現
[ -/:-@\[-~]

半角の英数字記号の表現

ASCIIコード表を見えるとわかりますが、半角スペースから、チルダ(~)まで、半角英数字と記号が定義された範囲になります。半角スペースは、ASCIIで32番、チルダは126番と定義されています。これは、

// 半角英数字記号
[ -~]

【応用】半角文字のみの文字列の正規表現

上記は一文字でしたが、これに両指定子を組み合わせて文字列とすることができます。たとえば、両指定子「+」は、直前のパターンの一文字以上の連続を表します。

// 半角英数字と記号の文字列
[ -~]+

別の量指定子では、文字列の長さの範囲を指定することもできます。

// 4文字以上、8文字以下の半角文字列
[ -~]{4,8}

両指定子に関しては、こちらに詳しくまとめています。

参考

その他の関連する正規表現についてです。

また、正規表現のサンプル集です。

以上です。

閉じる