正規表現：否定先読み、肯定先読みについて

正規表現

最終更新：2018-08-21 by Joe

正規表現で、便利だが、分かりにくい「否定先読み」「肯定先読み」についてまとめました。

正規表現「否定先読み」とは？

※2018.8.21: 記述訂正リクエストありがとうございました。

正規表現における「否定先読み（Negative lookahead）」とは、メインのマッチング処理とは独立したサブパターンのマッチングの吟味（テスト）の事です。「(?!」と「）」で、サブパターンを囲み、このような記述を用います。

正規表現を含まない記述

ここでいう「吟味（テスト）」とは、通常の「(」「)」で囲むようなサブパターンのマッチングと異なり、もしそのサブパターンのマッチが見かっても、マッチした文字列は「消費（Consume）」されず、同時に格納（Capture）されません。

これはすなわち、下記を意味します。

その後に実行されるマッチング処理の位置に影響しない。
サブパターンにマッチした文字列を後方参照するできない。

「処理位置の前方を吟味して、元の位置に戻ってきて処理を再開する。」これが先読みという由縁です。このようなテストを「言明（Assertion）」と言います。このような言明の表現は、否定/肯定の先読み/後読みとして、４つのパターンがあることでよく知られています。

名前	表現	詳細
否定先読み (Negative lookahead)	(?!pattern)	開始位置から前を読んで、pattern がマッチしなければテストはパス
否定後読み (Negative lookbehind)	(?<!pattern)	開始位置から後ろを読んで、pattern がマッチしなければテストはパス
肯定先読み (Positive lookahead)	(?=pattern)	開始位置から前を読んで、pattern がマッチすればテストはパス
肯定後読み (Positive lookbehind)	(?<=pattern)	開始位置から後ろを読んで、pattern がマッチすればテストはパス

否定先読みの使用例

説明だけではだいたいよくわからないので、まずは、否定先読み表現の例を見てみましょう。対象の文字列はこちらを吟味します。

例1-1「元SMAP」で開始しない１行

基本的な「行頭」を表す位置指定子「^」の直後に、先読みの「元SMAP」が開始するかどうかを吟味します。

// 元スマップで開始しない１行
^(?!元スマップ).*$

「.（ドット）」は改行以外の１文字、「*」は、直前のパターンの０回以上の繰り返しを表す量指定子、「$」は行末です。上記の対象文字列は、明らかに「元スマップ」で開始していますので、マッチはしません。

比較のため「肯定先読み」で考えています。

※2018/3/1 修正箇所のご連絡ありがとうございました。

例2-1「香取」を含まない１行

さて、前述の例は「行頭」という条件で吟味していましたが、１文全体を対象にしています。

否定先読みを使って、「香取」を含まない１行をマッチングしようとしてみます。

// 香取を含まない１行
^(?!.*香取).*$

正規表現「肯定先読み」とは？

先に否定先読みを紹介しましたが、肯定先読み（Positive lookahead）はもうすこしシンプルです。

「(?=」と「」)でパターンを囲みます。

肯定先読みの記述法

肯定先読みの例

例1「元SMAP」で開始する１行

肯定の先読みは、その名の通り、カッコ内のサブパターンがマッチすればテストが成功します。ただし、この下記のようなシンプルなケースでは合肯定先読みを利用する必要はありません。

// 元スマップで開始する１行
^(?=元スマップ).*$

ただし、このようなシンプルなケースでは合肯定先読みを利用する必要はありません。この例は、下記のシンプルな正規表現と（処理内容の違いはありますが）ほぼ同じ結果を得られます。

// 元スマップで開始する１行
^元スマップ.*$

例1-2香取を含む１行（部分一致）

サブパターンのテストが成功しても、マッチ文字列は「消費されない」性質を利用して、部分一致による文章全体をマッチングします。

もう想像が付きそうですが、香取を含むには、肯定先読みで表現できます。

// 香取を含む１行
^(?=.*香取).*$

以上です。

正規表現に関する参考情報

正規表現について、基礎的な内容、メタ文字の一覧やサンプルを広くまとめています。

正規表現とは？基本構文とメタ文字一覧（サンプル付）

正規表現：文字列を「含まない」否定の表現まとめ

正規表現2021-12-18

この記事では、「任意の文字を含まない」や「任意の文字列（パターン）を含まない」など、否定の意味を持った正規表現について、解説します。特に、後述する「否定先読み・戻り読み」を利用し1

正規表現：数字の表現。桁数や範囲など

正規表現2023-03-26

正規表現での、数字に桁数に関する方法に関してです。また、これを応用して、数字の大きさの範囲を指定します。

git pull を強制し、リモートでローカルを上書きする方法

Git2021-05-11

git pull して、リモートブランチの最新に合わせようとしたら・・、あれ？コンフリクト・・？なにこれ、うまくいかない！「git push -f origin masterして強1

正規表現：「行頭」「行末」の表現と、応用例

正規表現2018-07-20

正規表現の基本、行頭（行の先頭）と行末（行の末尾）を表す表現です。

正規表現での、OR（いずれか、または）の表現方法

正規表現2021-05-01

正規表現にいて、複数のパターンのうち「いずれか、または」を意味する「OR」を表現する方法についてです。

.gitignore の書き方。ファイル/ディレクトリの除外

Git2021-12-10

.gitignoreの書き方と仕様を、具体例をまじえてまとめました。「あれ？うまく反映されない・・」など、gitの仕様の理解不足からくるトラブルも解決していきます。

正規表現に関連する記事