콘텐츠로 건너뛰기
TBWA DATA LAB
  • SEO 컨설팅 서비스
    • 웹사이트 SEO
    • 유튜브 SEO
  • 블로그
  • 문의하기
Home » 검색엔진 최적화 » 구글 정규식 (구글 애널리틱스 활용법) – 특수문자, 예제, 패턴, 사이트

구글 정규식 (구글 애널리틱스 활용법) – 특수문자, 예제, 패턴, 사이트

  • by Jimin Seo
  • 2022년 10월 5일2023년 7월 19일
  • 1개의 댓글

구글 애널리틱스(Google Analytics)를 사용한다면 데이터 분석 시 정규 표현식 혹은 정규식(Regex)을 종종 접하게 됩니다. 정규 표현식을 사용하면 특정 데이터를 수집할 수 있지만 복잡해 보이는 문자열들로 어떻게 써야 할지 당황하신 경우가 있을 겁니다. 이번 포스트를 읽는다면 정규식을 이해할 수 있게 되며 이를 이용하여 구글 애널리틱스 (Google Analytics) 와 구글 데이터 스튜디오 (Google Data Studio) 에서 데이터 분석을 좀 더 수월하게 할 수 있습니다.

💡아래에서 관심 있는 주제를 클릭하여 해당 본문으로 바로 이동해보세요.

1. 정규 표현식(Regex) 란?

2.정규 표현식 패턴 및 특수문자

3.정규 표현식 테스트 및 예제

4.정규 표현식 사이트 추천

정규 표현식(Regex) 란?

정규 표현식 또는 정규식이란 광범위한 데이터 내에서 특정한 규칙을 가지고 있는 문자열을 표현하고 세부적인 패턴을 찾아 매칭합니다. 즉 정규식은 특정한 규칙을 가진 문자열의 집합을 표현하는 데 사용하는 형식 언어입니다. 문자열을 통해 세부적인 패턴을 필터링을 통해 빠르게 찾을 수 있기 때문에 정규식은 데이터 분식에 매우 유용합니다. 구글 애널리틱스에서 정규식을 사용하는 항목은 잠재고객, 콘텐츠 그룹, 목표, 보기 필터, 세그먼트, 채널 그룹 등이 있습니다. 마지막으로 구글 정규식을 공부할 때 주의할 점이 있습니다. 구글 정규식은 파이썬과 자바에서 쓰이는 정규식과 문법이 다릅니다. 따라서 파이썬 및 자바 정규식과 혼돈 하시면 안됩니다.

정규 표현식 패턴 및 특수문자

정규 표현식에는 와일드 카드(Wild Cards), 앵커Anchors), 그룹(Group), 이스케이프(Escape)가 있습니다

와일드 카드

.모든 문자 하나와 매칭g.
g가 들어간 모든 단어들은 매칭이 된다.
*앞의 문자와 0번 이상 동일x*
(반복 여부 표현) x문자가 0번 또는 그 이상 반복
?앞의 문자가 존재할 수도 존재 하지 않을 수도 있음x?
(존재 여부) x문자가 존재하는지 안하는지
+앞의 문자와 1회 이상 동일 x+
(반복 표현) x 문자가 한 번 이상 반복
|or 를 표현x|y
(or) x 또는 y 문자가 존재함

앵커

^문자열의 시작을 표현^x
x문자로 시작됨
$문자열의 종료를 표현$x
x문자로 종료

그룹

( )표현식 그룹 화 혹은 ( ) 안에 있는 문자열 순서대로 일치(xy)
xy 순서대로 모두 포함
[ ][ ] 안에 있는 문자열을 순서 상관없이 포함[xyz]
(문자 선택 표현) x, y, z 중 하나 혹은 모두 다 포함
[^ ][ ] 안에 있는 문자열을 포함하지 않은 문자열[^xyz]
x, y, z 중 하나 혹은 모두 포함하지 않음
_– 범위에 해당하는 문자열을 포함 x-z
x부터 z까지

이스케이프

\정규 표현식 아닌 문자로 표현하고 싶을 때\?
?는 정규 표현식이 아닌 문자로 사용

플래그

g모든 문자와 여러 줄 일치
i영어 대소문자 구분하지 않고 일치
m여러 줄 일치
u유니코드
ylastIndex 속성으로 지정된 인덱스에서만 1회 일치

정규 표현식 테스트 및 예제

배운 정규식을 사용하여 5개의 URL페이지 중 2번만 추출해 내는 식을 만들어 봅시다.

  • 1) https://www.google.co.jp
  • 2) https://www.google.com/tbwa/?
  • 3) https://www.google.co.kr/-tbwa/?
  • 4) http://www.google.com
  • 5) http://www.google.com/

1. “^” , “.” 와 “*”을 사용하여 https로 시작하는 URL만 분류합니다.

정규 표현식: ^https.*

결과:

  • 1) https://www.google.co.jp
  • 2) https://www.google.com/tbwa/?
  • 3) https://www.google.co.kr/-tbwa/?
2. “$”을 사용하여 ?로 끝나는 URL만 골라냅니다. 여기서 주의할 점은 ? 은 정규 표현식이기 때문에 그냥 문자라는 것을 나타내기 위해 “\”을 활용합니다.

정규 표현식: ^https.*\?$

결과:

  • 2) https://www.google.com/tbwa/?
  • 3) https://www.google.co.kr/-tbwa/?
3. “\” 앞에 “[^]”을 사용해서 -tbwa가 들어간 URL을 제거합니다.

정규 표현식: ^https.*[^-]\?$

결과:

  • 2) https://www.google.co.kr/tbwa/

팁: 정규식은 간단할 수록 좋기 때문에 최대한 간결하게 만드는 게 좋습니다.

정규 표현식 사이트 모음

내가 작성한 정규식이 맞는지 헷갈릴 때가 있을 겁니다. 그럴 때 다음 정규식 사이트에 들어가시면 내가 쓴 정규식을 확인할 수 있습니다. 아래 사이트는 정규식 사이트 중 가장 유명한 사이트입니다.

  1. http://www.regexr.com
  2. https://regex101.com/
  3. https://rubular.com/

정규식 테스트할 수 있는 사이트
Rubular 사이트


데이터 분석을 간편하게 할 수 있게 도와주는 정규 표현식에 대해 살펴봤습니다. 정규 표현식을 이용하면 효율적으로 원하는 문자열만 세부적으로 필터링하여 데이터를 빨리 찾을 수 있습니다. 구글 애널리스틱 혹은 데이터 스튜디오에서 분석할 때 일일이 다 필터링하느라 고생하셨던 분들은 정규 표현식을 꼭 사용해 보길 바랍니다.

TBWA 데이터랩 SEO 컨설팅 서비스 알아보기!
Jimin Seo
Jimin Seo
태그:정규 표현식정규식

“구글 정규식 (구글 애널리틱스 활용법) – 특수문자, 예제, 패턴, 사이트”의 1개의 댓글

  1. 핑백: ChatGPT 실전 활용법 - 디지털 마케팅 - TBWA 데이터랩

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

웹사이트 SEO
유튜브 SEO
문의하기
TBWA DATA LAB white logo with color

SEO 컨설팅 서비스

  • 웹사이트 SEO
  • 유튜브 SEO

TBWA\ DATA LAB

  • TBWA\ KOREA 공식 웹사이트
  • TBWA\ DATA LAB 공식 웹사이트
  • TBWA\ DATA LAB 블로그

문의하기

  • SEO 컨설팅 서비스 문의하기

뉴스레터 구독

  • 개인정보 처리방침
  • 이용약관
  • 쿠키정책
핵심 전략 컨설팅 받기
고객 유입부터 전환까지, 비즈니스 성장의 핵심 전략을 경험하세요.
핵심 전략 컨설팅 받기
고객 유입부터 전환까지, 비즈니스 성장의 핵심 전략을 경험하세요.
SEO 전문가가 추천하는 오늘의 글!

인스타그램 상위 노출 콘텐츠 유형 분석: 해시태그 검색에서 찾은 포맷 트렌드

DATALAB은 이 점에 주목하여, 인스타그램에서 마케팅 관련 해시태그를 검색했을 때 어떤 유형(포맷)의 콘텐츠가 주로 노출되는지 직접 데이터를 수집, 분석했습니다. 이 결과...
Read More

UGC란? 사용자 생성 콘텐츠 뜻과 특징, 마케팅 전략까지 알아보기

사용자 생성 콘텐츠(UGC)는 브랜드나 기업이 아닌 일반 사용자, 소비자, 또는 팬이 자발적으로 제작하고 공유하는 콘텐츠를 의미합니다. UGC는 이미지, 영상, 후기, 블로그 글...
Read More

파이썬(Python) SEO – 초보자를 위한 실전 가이드

파이썬의 특징은 직관적인 문법과 뛰어난 성능, 그리고 다양한 기능을 갖춘 라이브러리와 프레임워크 덕분에 많은 SEO 전문가들 또한 업무 자동화와 최적화에 파이썬을 적극 ...
Read More
  • 0
  • 1
  • 2
3s
SEO 전문가가 추천하는 오늘의 글!

인스타그램 상위 노출 콘텐츠 유형 분석: 해시태그 검색에서 찾은 포맷 트렌드

DATALAB은 이 점에 주목하여, 인스타그램에서 마케팅 관련 해시태그를 검색했을 때 어떤 유형(포맷)의 콘텐츠가 주로 노출되는지 직접 데이터를 수집, 분석했습니다. 이 결과...
Read More
TBWA KOREA DATA LAB 사이트는 쿠키를 사용합니다. "수락"을 클릭하시면 TBWA KOREA DATA LAB의 쿠키 사용에 동의함을 의미합니다.
쿠키 설정개인정보 처리방침수락
Manage consent

사이트에 사용되는 쿠키 종류 및 설정

다음은 본 사이트에서 사용하는 쿠키 목록입니다. 아래에서 쿠키 사용에 대한 선택을 표시할 수 있습니다. 선택에 따라 사이트 또는 당사의 제품 및 서비스를 충분히 활용하지 못할 수 있습니다.
필수 쿠키
필수 쿠키는 당사 사이트를 사용하고 탐색하는데 필수적인 쿠키를 의미합니다. 필수 쿠키는 사용자를 인증할 수 있는 세션 ID 및 기타 서버 정보와 같은 정보를 수집하는 데 도움이 됩니다. 필수 쿠키는 여러분이 검색 세션을 종료하거나 이후 짧은 시간 내에 즉시 삭제됩니다.
기능성 쿠키
기능성 쿠키는 여러분의 선택에 대한 정보를 수집하거나 여러분의 선호 사항을 기억하여 관련 콘텐츠를 보여줄 수 있습니다. 이를 통해 당사는 여러분의 위치를 식별하고 브라우징 세션 중에 여러분의 언어를 기억하고 여러분이 접근한 사이트를 맞춤화할 수 있습니다. 기능성 쿠키는 브라우징 세션을 종료하면 삭제됩니다.
분석 쿠키
당사는 분석 쿠키를 사용하여 여러분이 당사 웹사이트를 탐색하는 방법, 여러분이 방문한 페이지, 여러분이 페이지에 머무르는 시간, 페이지가 여러분에게 올바르게 표시되는지에 대한 여부 또는 오류 발생 여부와 같은 여러분이 당사 사이트를 탐색하고 사용하는 방법에 대한 정보를 수집합니다. 분석 쿠키는 당사 사이트의 성능을 개선하고 사이트를 보다 사용자 친화적으로 만드는 데 도움이 됩니다. 분석 쿠키 중 일부는 여러분이 삭제하지 않는 한 여러분이 브라우징 세션을 종료한 후 특정 기간 동안 여러분의 컴퓨터 또는 기타 인터넷 연결 장치에 남아있는 영구 쿠키입니다. 분석 쿠키는 Google Analytics에서 제공합니다. Google Analytics의 쿠키에 대한 자세한 내용은 Google Analytics 고객센터를 통해 확인하세요.
SAVE & ACCEPT