Daily Notebook

문자열 사이의 특정 단어 추출하기

by 배부른코딩로그
💡 정규표현식을 통해 특정 문자 사이의 단어를 추출해보자!

목표

  • 정규표현식을 통해 특정 단어 사이의 단어를 추출할 수 있다.
  • 정규표현식에서 괄호의 의미를 정확하게 설명할 수 있다.
  • Java, Javascript 등 특정 단어 사이의 문자열을 추출하는 코드를 작성할 수 있다.

 

문자열 관련 개발을 하다보면 정규표현식을 은근 자주 사용하게 된다.

파라미터로 들어온 문자열 콘텐츠 내에 특정 단어를 추출해야 할 경우가 간혹 생긴다.

 

이럴 때, 정규표현식이 기가막히게 사용된다.

알아두면 유용하게 쓸 수 있다

 

final String REGEX_GET_WORD = "(\\b특정단어\\b)(.*?)(\\b특정단어\\b)";

String content = "특정단어 문자열 사이의 값 특정단어 추출하기";

Pattern pattern = Pattern.compile(REGEX_GET_WORD);
Matcher matcher = pattern.matcher(content);
if (matcher.find()){
	return matcher.group(2).trim(); // 특정 단어 사이의 값 추출
}

위의 정규식을 통해 특정 문자 사이에 위치한 값을 추출할 수 있다.

group(2)의 의미가 중요하다.

정규식에서 괄호(())하나의 단어 그룹으로 인식하기 때문에 '두 번째 괄호의 값을 가져오겠다'는 의미이다.

  • 정규식 분석해보기
    • \b는 단어의 경계를 의미한다.
    • ( ) 괄호 묶음은 하나의 그룹이다.

 

출처

 

Last Updated. 2022. 04. 15.

 

 

 

 

 

반응형

블로그의 정보

배부른코딩로그

배부른코딩로그

활동하기