본문 바로가기

Growth Hacking/Google Analytics

구글 애널리틱스 4(Google Analytics 4, GA4) - 필터

 이전의 구글 애널리틱스에서 가장 중요한 기능 3가지만 뽑으라고하면 어떤 것일까요? 저는 필터(Filter), 세그먼트(Segment), 맞춤형 리포트(Custom report)라고 이야기해왔었는데요. 오늘은 그 중 필터에 대한 이야기를 해볼까합니다.

  기존의 구글 애널리틱스에서는 하나의 속성(Property)에 3개의 보기(View)를 만드는 것이 일반적인 가이드였습니다. 손을 타지않은 raw데이터 보기와 대시보드로 사용할 수 있도록 만든 가공한 보기(Master view) 그리고 QA를 진행할 수 도록 셋팅해놓는 테스트 보기까지 총 3가지의 보기를 만드는 것을 권장하였었는데요. 이제 구글 애널리틱스 4에서는 더 이상 보기가 없이 속성만 존재합니다. 그래서 이전과 필터링하는 개념도, 방식도 많이 바뀌었는데요. 구글 애널리틱스 4에서는 필터를 크게 내부 트래픽 필터와 개발자 트래픽 필터로 구분할 수 있습니다. 내부 트래픽 필터는 유입된 트래픽을 바탕으로 식별하여 필터링하는 것이며, 개발자 트래픽 필터는 개발 기기의 이벤트 데이터를 필터링 하는 것입니다. 그래서 오늘은 내부 트래픽에 대해 집중적으로 살펴보려합니다.

  • 내부 트래픽

 내부 트래픽은 단일 IP주소 및 특정 IP주소의 range에서 발행하는 모든 트래픽을 의미하는데요. 보다 깔끔한 데이터를 만들기 위해서는 회사 IP주소 대역폭을 제외해야하는 작업이 필요합니다. 더불어 구글 애널리틱스의 필터기능은 필터를 적용한 시점부터 평가되며, 이전의 데이터에는 영향을 미치지 않습니다. 예를 들면, 2021년 2월 9일 21시 30분에 필터를 적용하였다면, 2021년 2월 8일 20시의 데이터에는 해당 필터가 영향을 미치지 않는 것이죠. 그렇기 때문에 기존의 구글 애널리틱스에서도 신중하게 필터 기능을 사용해야 했으며, 3개의 보기 생성을 권장하는 이유입니다. 또한 데이터는 기업의 큰 자산이기 때문에 아무나 쉽게 접근해서는 안되며, 필터 생성, 수정 및 삭제를 하시려면 속성(Property) 수준에서 수정 이상의 권한을 필요로 합니다.

구글의 경고문..

 하지만 기존 구글 애널리틱스와는 달리 구글 애널리틱스 4에서는 IP주소 이외 호스트 이름, 요청 URI, 캠페인 소스 등등 다양한 옵션을 사용할 수 없습니다. 다만, 구글 애널리틱스 4는 IP필터링을 지원하며, IPv4와 더불어 IPv6까지 지원합니다. 또한 이를 CIDR 표기법을 바탕으로 지정할 수 있는데요. 예를 들면, IPv4 주소가 111.0.2.1~111.0.2.256일 경우 111.0.2.1/24로 표시(자세한 내용 보러가기)할 수 있으며, IPv6 주소에도 2001:0db8::/32 등으로 적용할 수 있습니다(CIDR 계산기).

  • 내부 트래픽 필터 방법

 내부 트래픽 필터는 웹(PC/MWEB) 속성에서만 지원하는데요(IOS/AOS 사용불가). 우선 아래와 같이 '속성 > 데이터 스트림 > 데이터 스트림명'을 클릭합니다.

 누르시면 하단에 '태그 설정 더보기'를 확인하실 수 있는데요. 이 버튼을 눌러줍니다.

  그리고 '내부 트래픽 정의'를 클릭하여 '내부 트래픽 규칙을 정의'해주시면 되는데요.

 내부 트래픽 값은 기본으로 internal이라는 값으로 설정되어 있습니다. 이를 변경하기를 원하신다면 자유롭게 설정해주시고, IP주소를 정의하여 생성해주세요. 생성이 완료되었다면, 실제로 이를 적용하기 위해 다시 '속성 > 데이터 설정 > 데이터 필터'로 이동합니다. 그리고 '필터 만들기 > 내부 트래픽'으로 이동하여 '다음 매개변수 값이 있는 이벤트 필터링' 컬럼에 상단에서 적용했던 필터 정의했던 값을 넣어줍니다. 설정을 바꾸지 않으셨다면 internal로 입력하시면 되며, 상단에서 정의했던 이름으로 넣어주시면 됩니다.

  마지막 단계입니다. 필터 상태를 '활성'으로 바꾼 후 저장을 하시면, 적용되는 시점으로부터 데이터가 필터링이 됩니다. 적용 이전에 테스트를 해보고싶으시다면 '테스트'로 저장하시고, 실시간 리포트에서 '테스트 데이터 필터 이름'이라는 측정기준(Dimension)으로 확인해보실 수 있습니다. 반대로 '비활성'은 필터를 사용하지 않는다는 것입니다. 

 즉, IP를 정의하고 선언한 후 데이터 필터를 적용하는 플로우라 생각해주시면 될 것 같습니다.

  • 나가며...

 모든 데이터 분석의 70%는 데이터 클렌징이라 할 수 있습니다. 구글 애널리틱스에서 데이터 클렌징의 가장 큰 작업을 뽑자면 필터라 할 수 있는데요. 반드시 필터를 테스트하고, 적용하는 습관을 길러 멋진 분석을 하시면 좋겠습니다.