문자열 사이의 특정 단어 추출하기
by 배부른코딩로그💡 정규표현식을 통해 특정 문자 사이의 단어를 추출해보자!
목표
- 정규표현식을 통해 특정 단어 사이의 단어를 추출할 수 있다.
- 정규표현식에서 괄호의 의미를 정확하게 설명할 수 있다.
- Java, Javascript 등 특정 단어 사이의 문자열을 추출하는 코드를 작성할 수 있다.
문자열 관련 개발을 하다보면 정규표현식을 은근 자주 사용하게 된다.
파라미터로 들어온 문자열 콘텐츠 내에 특정 단어를 추출해야 할 경우가 간혹 생긴다.
이럴 때, 정규표현식이 기가막히게 사용된다.
알아두면 유용하게 쓸 수 있다
final String REGEX_GET_WORD = "(\\b특정단어\\b)(.*?)(\\b특정단어\\b)";
String content = "특정단어 문자열 사이의 값 특정단어 추출하기";
Pattern pattern = Pattern.compile(REGEX_GET_WORD);
Matcher matcher = pattern.matcher(content);
if (matcher.find()){
return matcher.group(2).trim(); // 특정 단어 사이의 값 추출
}
위의 정규식을 통해 특정 문자 사이에 위치한 값을 추출할 수 있다.
group(2)의 의미가 중요하다.
정규식에서 괄호(())를 하나의 단어 그룹으로 인식하기 때문에 '두 번째 괄호의 값을 가져오겠다'는 의미이다.
- 정규식 분석해보기
- \b는 단어의 경계를 의미한다.
- ( ) 괄호 묶음은 하나의 그룹이다.
출처
- Learn Regex: A Beginner's Guide, Michael Wanyoike, 2020-07-02
Last Updated. 2022. 04. 15.
반응형
블로그의 정보
배부른코딩로그
배부른코딩로그