정규표현식
regular expression, 간단히 regexp 또는 regex, rational expression) 또는 정규식이라 불림.
특정한 규칙을 가진 문자열의 집합을 표현하는 데 사용하는 형식 언어
텍스트패턴을 기술하기 위한, 패턴에 맞는 문자열을 검색할때 사용
정규 표현식 자체의 문법도 여러 가지 존재
https://ko.wikipedia.org/wiki/%EC%A0%95%EA%B7%9C_%ED%91%9C%ED%98%84%EC%8B%9D
정규표현식 테스트기
몇가지 정규표현식을 알아보자.
\n과 . \n를 제외한 모든문자
*는 앞에 문자가 0개~무한대로 위치 할 수있는 반면, + 는 앞에 최소 1개~무한대로 위치 할 수 있다.
[]는 안에있는 모든 문자들과 매치되어야한다, -를 이용해 범위
[0-9] = \d 숫자, [^0-9] = \D는 그 반대의 의미로 숫자가 아닌것들은 선택한다.
[가-힣a-zA-Z0-9_] = \w 특수기호를 제외한 문자만 선택한다.
[^가-힣a-zA-Z0-9_] = \W, 반대의 의미로 문자가 아닌것을 모두 선택한다.
[가-힣] 한글만 선택
\s 공백, 그리고 공백을 제외한 모든것.
*과 함께 사용하면 묶음으로 선택되어 아래처럼 문자묶음, 공백모음으로 선택 가능하다.
위의 방법을 이용하여 p태그 하나를 묶음으로 선택할 수 있다.
정규표현식은 여러패턴이 있으며, 언어마다 그 문법이 다를 수 있다.
단 몇 글자만으로 원하는 코드를 선택할 수 있어
코드를 꽤 줄여줄 수 있음이 특징이다.
'이론' 카테고리의 다른 글
언어의 과정, 리눅스타임라인 Linux timeline (0) | 2023.03.05 |
---|---|
NTP와 UTC의 차이 (0) | 2023.03.05 |
ASCII Code, 문자와 호환되는 아스키코드 (0) | 2023.03.05 |
Unix 유닉스와 Linux 리눅스, 운영 체제 (0) | 2023.03.05 |
ID의 뜻 (0) | 2023.03.05 |