/ /

/ /

정규식(쿼리 자 연산자)

참고

이 페이지에서는 자체 관리(비Atlas) 배포를 위한 정규 표현식 검색 기능에 대해 설명합니다. MongoDB 에서 호스팅되는 데이터의 경우, MongoDB 자체 $regex 연산자 있는 향상된 전체 텍스트 검색 솔루션인 MongoDB Search도 제공합니다. 자세한 학습 은 MongoDB Search 문서에서 $regex를 참조하세요.

정의

$regex: 쿼리에서 문자열 패턴 일치 에 대한 정규식 기능을 제공합니다.

호환성

다음 환경에서 호스팅되는 배포에 $regex 사용할 수 있습니다.

MongoDB Atlas: 클라우드에서의 MongoDB 배포를 위한 완전 관리형 서비스

MongoDB Enterprise: MongoDB의 구독 기반 자체 관리 버전
MongoDB Community: MongoDB의 소스 사용 가능 무료 자체 관리 버전

구문

다음 구문 변형 중 하나를 사용합니다.

{ <field>: { $regex: /pattern/, $options: '<options>' } }
{ "<field>": { "$regex": "pattern", "$options": "<options>" } }
{ <field>: { $regex: /pattern/<options> } }

참고

$regex 을(를) mongodump와(과) 함께 사용하려면 쿼리 문서 작은따옴표('{... }')로 묶어 shell 과 상호 작용 하지 않도록 합니다.

쿼리 문서는 필드 이름과 연산자를 따옴표로 묶는 등 확장 JSON v2 형식 (완화 모드 또는 표준/엄격 모드)이어야 합니다. 예시:

mongodump -d=sample_mflix -c=movies  -q='{"year": {"$regex": "20"}}'

정규 표현식 객체(/pattern/)를 사용하여 정규 표현식을 지정할 수도 있습니다.

{ <field>: /pattern/<options> }

구문 사용에 대한 제한 사항은 $regex vs. /패턴/ 구문참조하세요.

$options

다음 <options> 는 정규 표현식에 사용할 수 있습니다.

옵션	설명
`i`	대소문자를 구분하지 않고 대문자와 소문자를 일치시킵니다. 예시 는 대소문자를 구분하지 않는 정규 표현식 일치 수행하기를 참조하세요.
`m`	앵커를 포함하는 패턴(시작은 `^`, 끝은 `$`)의 경우 여러 줄 값이 있는 문자열의 경우 각 줄의 시작 또는 끝에서 일치시킵니다. 이 옵션이 없으면 이러한 앵커는 문자열의 시작 또는 끝에서 일치합니다. 예시는 지정된 패턴으로 시작하는 줄에 대한 여러 줄 일치 항목을 참조하세요. 패턴 에 앵커가 없거나 string 값에 개행 문자가 없는 경우( 예시: `\n`) `m` 옵션은 효과가 없습니다.
`x`	`$regex` 패턴의 모든 공백 문자를 무시하는 "확장" 기능을 제공하며, 이스케이프 처리되거나 문자 클래스에 포함되지 않는 한 적용됩니다. 또한 이스케이프되지 않은 해시/파운드 (`#`) 문자와 그 다음 개행까지의 문자를 무시하여 복잡한 패턴에 주석을 포함할 수 있습니다. 이 규칙은 데이터 문자에만 적용되며, 패턴의 특수 문자 시퀀스 내에는 공백 문자가 나타날 수 없습니다. `x` 옵션은 VT 문자(코드 11) 처리에 영향을 주지 않습니다.
`s`	점 문자(`.`)가 개행 문자를 포함한 모든 문자와 일치하도록 허용합니다. 예시 는 `.` 점 문자를 사용하여 새 줄에 맞추기를 참조하세요.
`u`	유니코드 옵션은 허용되지만 중복됩니다. UTF는 `$regex`에 대해 기본값 으로 활성화되어 있습니다.

참고

$regex 전역 검색 수정자 g을(를) 지원 하지 않습니다.

행동

정규식 대 /패턴/ 구문

`$in` 표현식

$in 쿼리 조건자 연산자에 정규 표현식을 포함하려면 JavaScript 정규 표현식 객체(/pattern/)만 사용할 수 있습니다.

예를 들면 다음과 같습니다.

{ name: { $in: [ /^acme/i, /^ack/ ] } }

$in 연산자 내에서 $regex연산자 표현식을 사용할 수 없습니다 .

필드에 대한 암시적 `AND` 조건

필드에 대한 쉼표로 구분된 쿼리 조건 목록에 정규 표현식을 포함하려면 $regex 연산자를 사용합니다. 예시:

{ name: { $regex: /acme.*corp/i, $nin: [ 'acmeblahcorp' ] } }
{ name: { $regex: /acme.*corp/, $options: 'i', $nin: [ 'acmeblahcorp' ] } }
{ name: { $regex: 'acme.*corp', $options: 'i', $nin: [ 'acmeblahcorp' ] } }

`x` 및 `s` 옵션

x 옵션 또는 s 옵션을 사용하려면 $regex 연산자 표현식을 $options 연산자와 함께 사용해야 합니다. 예를 들어 i 및 s 옵션을 지정하려면 두 옵션 모두에 $options를 사용해야 합니다.

{ name: { $regex: /acme.*corp/, $options: "si" } }
{ name: { $regex: 'acme.*corp', $options: "si" } }

PCRE와 JavaScript 비교

PCREJavaScript 에서 지원되지 않는 지원 기능을 정규 표현식 에서 사용하려면 $regex 연산자 사용하고 패턴 문자열로 지정합니다.

대소문자를 구분하지 않는 문자열을 일치시키려면 다음을 수행하십시오.

"(?i)" 대/소문자를 구분하지 않는 일치를 시작합니다.
"(?-i)" 대/소문자를 구분하지 않는 일치를 종료합니다.

예를 들어 표현식 "(?i)a(?-i)cme" 은(는) 다음과 같은 문자열과 일치합니다.

"a" 또는 "A" 으로 시작합니다. 대소문자를 구분하지 않는 일치입니다.
"cme"로 끝납니다. 대소문자를 구분하는 일치 항목입니다.

이러한 문자열은 표현식과 일치합니다:

"acme"
"Acme"

다음 예시에서는 $regex 연산자를 사용하여 정규 표현식 "(?i)a(?-i)cme" 와(과) 일치하는 name 필드 문자열을 찾습니다.

{ name: { $regex: "(?i)a(?-i)cme" } }

버전 6.1부터 MongoDB는 PCRE2(Perl 호환 정규 표현식) 라이브러리를 사용하여 정규 표현식 패턴 일치를 구현합니다. PCRE 2에 대한 자세한 내용은 PCRE 설명서를 참조하세요.

`$regex` 개인정보 정책에 `$not`

$not 연산자 두 가지 모두에서 논리적 NOT 연산을 수행할 수 있습니다.

정규 표현식 객체(/pattern/)
예를 들면 다음과 같습니다.
```
db.inventory.find( { item: { $not: /^p.*/ } } )
```
$regex 연산자 표현식
예를 들면 다음과 같습니다.
```
db.inventory.find( { item: { $not: { $regex: "^p.*" } } } )
db.inventory.find( { item: { $not: { $regex: /^p.*/ } } } )
```

인덱스 사용하기

$regex 쿼리의 인덱스 사용 및 성능은 쿼리 대소문자를 구분하는지 아니면 대소문자를 구분하지 않는지에 따라 달라집니다.

대소문자를 구분하는 쿼리

대소문자를 구분하는 정규 표현식 쿼리의 경우, 필드 에 대한 인덱스 존재하면 MongoDB 정규 표현식 인덱스 의 값과 일치시킵니다. 이는 컬렉션 스캔 보다 빠를 수 있습니다.

정규 표현식 '접두사 표현식'인 경우, 즉 모든 잠재적 일치 항목이 동일한 문자열로 시작하는 경우 추가 최적화가 발생할 수 있습니다. 이를 통해 MongoDB 해당 접두사에서 "범위 "를 구성하고 지정된 범위 내의 인덱스 값만 일치시킬 수 있습니다.

정규 표현식 캐럿(^) 또는 왼쪽 앵커(\A)로 시작하고 그 뒤에 간단한 기호의 문자열이 오는 경우 "접두사 표현식" 입니다. 예시 들어, 정규식 /^abc.*/ 는 abc으로 시작하는 인덱스 의 값만 일치하도록 최적화됩니다.

또한 /^a/, /^a.*/ 및 /^a.*$/ 는 동등한 문자열과 일치하지만 성능 특성이 다릅니다. 이러한 모든 표현식은 적절한 인덱스 있는 경우 인덱스 사용합니다. 그러나 /^a.*/ 및 /^a.*$/ 는 느립니다. /^a/ 는 접두사 일치 후 스캔을 중지할 수 있습니다.

대소문자를 구분하지 않는 쿼리

$regex 연산자는 데이터 정렬을 인식하지 않으므로 이러한 인덱스를 활용할 수 없기 때문에 대소문자를 구분하지 않는 인덱스는 $regex 쿼리의 성능을 향상시키지 않습니다.

예시

이 섹션의 예시에서는 다음의 products collection을 사용합니다.

db.products.insertMany( [
   { _id: 100, sku: "abc123", description: "Single line description." },
   { _id: 101, sku: "abc789", description: "First line\nSecond line" },
   { _id: 102, sku: "xyz456", description: "Many spaces before     line" },
   { _id: 103, sku: "xyz789", description: "Multiple\nline description" },
   { _id: 104, sku: "Abc789", description: "SKU starts with A" }
] )

`LIKE` 매치 수행

다음 예시는 sku 필드가 "%789" 과 같은 모든 문서와 일치합니다.

db.products.find( { sku: { $regex: /789$/ } } )

이 예시 는 다음 SQL LIKE 성명서 유사합니다.

SELECT * FROM products
WHERE sku like "%789";

출력 예시:

[
   { _id: 101, sku: 'abc789', description: 'First line\nSecond line' },
   { _id: 103, sku: 'xyz789', description: 'Multiple\nline description' },
   { _id: 104, sku: 'Abc789', description: 'SKU starts with A' }
]

대소문자를 구분하지 않는 정규식 일치 수행

다음 예시 i 옵션을 사용하여 ABC로 시작하는 sku 값에 대해 대소문자를 구분하지 않는 일치를 수행합니다.

db.products.find( { sku: { $regex: /^ABC/i } } )

출력 예시:

[
   { _id: 100, sku: 'abc123', description: 'Single line description.' },
   { _id: 101, sku: 'abc789', description: 'First line\nSecond line' },
   { _id: 104, sku: 'Abc789', description: 'SKU starts with A' }
]

전체 단어만 일치

전체 단어만 일치시키려면 \b 단어 경계 앵커를 사용합니다. 단어 경계는 단어 문자와 비단어 문자 사이의 위치 또는 문자열의 시작 또는 끝에서의 위치와 일치합니다.

다음 예시 description 필드 에 line 단어가 완전한 단어로 포함되어 있지만 multiline와 같은 다른 단어의 일부로 포함되어 있지 않은 문서를 일치시킵니다.

db.products.find( { description: { $regex: /\bline\b/ } } )

[
   { _id: 100, sku: 'abc123', description: 'Single line description.' },
   { _id: 101, sku: 'abc789', description: 'First line\nSecond line' },
   { _id: 102, sku: 'xyz456', description: 'Many spaces before     line' }
]

MongoDB description 필드 에 단어 Multiple\nline의 일부로만 line 가 포함되어 있기 때문에 _id: 103 이 있는 문서 를 반환하지 않습니다. \n (줄 바꿈)은 두 번째 발생에 대한 단어 경계 역할을 합니다.

참고

UTF-8 문자와 단어 경계를 일치시키는 방법은 ASCII 외부의 문자와 일치하도록 정규식 옵션 확장을 참조하세요.

지정된 패턴으로 시작하는 줄에 대한 여러 줄 일치 검색

다음 예시에서는 m 옵션을 사용하여 여러 줄 문자열에 대해 S 문자로 시작하는 줄을 일치시킵니다.

db.products.find( { description: { $regex: /^S/, $options: 'm' } } )

출력 예시:

[
   { _id: 100, sku: 'abc123', description: 'Single line description.' },
   { _id: 101, sku: 'abc789', description: 'First line\nSecond line' },
   { _id: 104, sku: 'Abc789', description: 'SKU starts with A' }
]

m 옵션이 없는 경우 예시 출력은 다음과 같습니다.

[
   { _id: 100, sku: 'abc123', description: 'Single line description.' },
   { _id: 104, sku: 'Abc789', description: 'SKU starts with A' }
]

$regex 패턴 에 앵커가 포함되어 있지 않으면 패턴 이 전체 문자열과 일치합니다. 예시 들면 다음과 같습니다.

db.products.find( { description: { $regex: /S/ } } )

출력 예시:

[
   { _id: 100, sku: 'abc123', description: 'Single line description.' },
   { _id: 101, sku: 'abc789', description: 'First line\nSecond line' },
   { _id: 104, sku: 'Abc789', description: 'SKU starts with A' }
]

`.` 점 문자를 사용하여 새 줄과 일치시키기

다음 예시 s 옵션을 사용하여 점 문자(.)가 새 줄을 포함한 모든 문자와 일치하도록 허용하고 i 옵션을 사용하여 대소문자를 구분하지 않고 일치를 수행합니다.

db.products.find( { description: { $regex: /m.*line/, $options: 'si' } } )

출력 예시:

[
   { _id: 102, sku: 'xyz456', description: 'Many spaces before     line' },
   { _id: 103, sku: 'xyz789', description: 'Multiple\nline description' }
]

s 옵션이 없으면 쿼리 을 반환합니다.

[
   { _id: 102, sku: 'xyz456', description: 'Many spaces before     line' }
]

패턴에서 공백 무시

다음 예에서는 x 옵션을 사용하여 공백과 일치 패턴에서 # 로 표시되고 \n 로 끝나는 주석을 무시합니다.

var pattern = "abc #category code\n123 #item number"
db.products.find( { sku: { $regex: pattern, $options: "x" } } )

출력 예시:

[
   { _id: 100, sku: 'abc123', description: 'Single line description.' }
]

정규식을 사용하여 문자열의 대소문자 일치시키기

다음 예시에서는 표현식 "(?i)a(?-i)bc" 을(를) 사용하여 sku 필드 문자열이 포함된 항목과 일치시킵니다:

"abc"
"Abc"

db.products.find( { sku: { $regex: "(?i)a(?-i)bc" } } )

출력 예시:

[
   { _id: 100, sku: 'abc123', description: 'Single line description.' },
   { _id: 101, sku: 'abc789', description: 'First line\nSecond line' },
   { _id: 104, sku: 'Abc789', description: 'SKU starts with A' }
]

정규식 옵션을 확장하여 ASCII 이외의 문자와 일치시키기

버전 6.1에 추가.

기본값 으로 일부 정규식 옵션(예: /b 및 /w)은 ASCII 문자만 인식합니다. 이로 인해 UTF-8 문자에 대해 정규식 일치를 수행할 때 예기치 않은 결과가 발생할 수 있습니다.

MongoDB 6.1부터는 UTF-8 문자와 일치하도록 *UCP 정규식 옵션을 지정할 수 있습니다.

중요

UCP 옵션의 성능

*UCP은(는) 일치를 수행하기 위해 다단계 테이블 조회가 필요하므로 *UCP 옵션을 사용하면 옵션을 지정하지 않은 경우보다 쿼리 속도가 느려집니다.

예를 들어 songs collection에 다음 문서가 있다고 가정해 보겠습니다.

db.songs.insertMany( [
   { _id: 0, "artist" : "Blue Öyster Cult", "title": "The Reaper" },
   { _id: 1, "artist": "Blue Öyster Cult", "title": "Godzilla" },
   { _id: 2, "artist" : "Blue Oyster Cult", "title": "Take Me Away" }
] )

다음 정규식 쿼리는 정규식 일치에서 \b 옵션을 사용합니다. \b 옵션은 단어 경계와 일치합니다.

db.songs.find( { artist: { $regex: /\byster/ } } )

출력 예시:

[
   { _id: 0, artist: 'Blue Öyster Cult', title: 'The Reaper' },
   { _id: 1, artist: 'Blue Öyster Cult', title: 'Godzilla' }
]

반환된 artist 필드의 전체 단어 중 일치하는 string(yster)로 시작하는 단어가 없기 때문에 이전 결과는 예상치 못한 결과입니다. Ö 는 UTF-8 문자이므로 문서 _id: 0 및 _id: 1 의 Ö 문자는 일치를 수행할 때 무시됩니다.

예상되는 결과는 쿼리 어떤 문서도 반환하지 않는다는 것입니다.

쿼리에서 UTF-8 문자를 인식할 수 있도록 하려면 패턴 앞에 *UCP 옵션을 지정하십시오.

db.songs.find( { artist: { $regex: "(*UCP)/\byster/" } } )

이전 쿼리 문서를 반환하지 않으며, 이는 artist 필드의 전체 단어 중 yster 문자열로 시작하는 단어가 없기 때문에 예상된 결과입니다.

팁

정규식 패턴의 이스케이프 문자

*UCP 또는 기타 정규 표현식 옵션을 지정할 때는 shell 또는 드라이버 에 맞는 이스케이프 문자를 사용하세요.

돌아가기

$mod

어디

참고

정의

호환성

구문

참고

참고

행동

정규식 대 /패턴/ 구문

$in 표현식

필드에 대한 암시적 AND 조건

x 및 s 옵션

PCRE와 JavaScript 비교

$regex 개인정보 정책에 $not

인덱스 사용하기

대소문자를 구분하는 쿼리

대소문자를 구분하지 않는 쿼리

예시

LIKE 매치 수행

대소문자를 구분하지 않는 정규식 일치 수행

전체 단어만 일치

참고

지정된 패턴으로 시작하는 줄에 대한 여러 줄 일치 검색

. 점 문자를 사용하여 새 줄과 일치시키기

패턴에서 공백 무시

정규식을 사용하여 문자열의 대소문자 일치시키기

정규식 옵션을 확장하여 ASCII 이외의 문자와 일치시키기

중요

UCP 옵션의 성능

팁

정규식 패턴의 이스케이프 문자

`$in` 표현식

필드에 대한 암시적 `AND` 조건

`x` 및 `s` 옵션

`$regex` 개인정보 정책에 `$not`

`LIKE` 매치 수행

`.` 점 문자를 사용하여 새 줄과 일치시키기