[기고] 우리 병원 다음달 내원객 숫자 예측하기


0
글자크기 설정
최대 작게
작게
보통
크게
최대 크게

수의사이자 경영자인 원장님들에겐 신경써야 할 부분이 많지만, 그 중에서도 가장 핵심적인 것은 ‘내 병원이 앞으로 (얼마나) 잘 될 것인가’이지 않을까 합니다.

향후 우리 병원을 방문하는 내원객의 숫자에 따라서 경영 방침을 수립하고, 주요한 의사결정을 내리고, 자신의 일정과 스탭들의 근무표를 관리하고… 하다못해 약품이나 소모품 주문량도 조정해야 하니까요.

지금까지는 최선을 다해 진료한 뒤 보호자들이 내원해주길 기대하는 ‘진인사대천명’적인 관념이 주류였습니다만, 데이터랩에서 조금 다른 견해를 제시해보려고 합니다.

다음 달에 우리 병원에 내원할 보호자의 숫자 이번 달과 지난 달 데이터만 있어도 어느 정도 정확히 예측할 수 있습니다.

 

# 고객은 어떻게 분류되는가

앞서 기고했던 ‘초진비용이 비싸면 떠나갈까?(보러가기)’에서 고객의 통산 재방문율과 관련된 데이터를 다루었는데요,

잠시 시선을 온라인으로 돌려보겠습니다. 게임 앱처럼 고객을 최대한 자주, 길게 체류시켜야 하는 온라인 서비스에서는 최소 24시간(1일) 단위로 고객의 방문을 관리합니다.

매일 앱을 활용하는 사람 수를 집계해 DAU(Daily Active Users, 일일 활성 유저)로 통칭하는데요, 1일 재방문율(1-Day Retention)과 함께 매우 중요한 의미를 부여합니다.

온라인 서비스에서 1일 재방문율 관리가 중요한 이유는 한 명의 고객을 획득하는데 드는 비용이 비싸기도 하고 어렵게 획득한 고객이 어떤 이유로든 서비스를 떠나버리면 다시 붙잡는 것도 어렵기 때문입니다.

그래서 데이터(프로덕트) 분석가들은 기본적으로 고객을 크게 두 그룹으로 나눕니다. 최초로 고객이 유입된 이후 다음 날에도 서비스를 이용한 경우(Retention)와 더 이상 이용하지 않은 경우(Churn)입니다.

그리고 각 고객군의 특성이나 서비스 이용양태를 분석합니다. 유지된 고객은 왜 우리의 고객이 되었는지, 이탈한 고객은 왜 떠나갔는지, 궁극적으로 고객을 놓치지 않으려면 무엇을 해야 하는지 인사이트를 도출하고 개선점을 찾아내는 거죠.

다만, 아시다시피 동물병원에서 DAU 측정은 큰 의미가 없습니다. 보호자가 병원을 매일 오는 것은 아니니까요.

통원이 수반되는 가벼운 진료라면 7일·14일 재방문율, 기저질환 없이 구충이나 심장사상충 같은 예방진료를 정기적으로 받는 경우까지 포함하면 MAU(Monthly Active Users)와 1개월 재방문율을 보는 게 적절하겠죠.

 

# 하지만 진료는 온라인 서비스가 아니다

여기까지는 실제 데이터를 보지 않아도 누구나 할 수 있는 상식적인 판단입니다. 하지만 온라인 프로덕트를 담당하던 사람이 EMR 데이터를 본다면 이내 혼란에 빠질 겁니다(제가 그랬습니다).

왜냐하면 동물병원 고객의 이용패턴이 온라인 서비스의 고객 패턴과는 다르기 때문입니다.

온라인 서비스에서 (N)AU와 (N)일 리텐션을 중심으로 한 여러 분석 모델이나 방법론이 유효한 이유는 일정 기간 이상 방문하지 않은 고객은 사실상 ‘완전히 떠나간’ 고객이 되기 때문입니다. 그들이 데이터에 미치는 영향은 무시해도 될 만큼 작아지죠.

하지만 온라인 서비스라면 완전히 떠나갔을 것으로 판단했을 고객이 동물병원에서는 짧게는 수 개월에서 길게는 몇 년 뒤에 ‘되살아나는’ 경우가 많습니다.

다음 그림은 EMR 기반 고객 데이터 분석에 동의한 A동물병원개원 초기 내원 고객중 임의로 추출한 유효고객 60여명의 13년간 월간 방문 패턴입니다. 실제 매출이 발생한 경우만 유효고객으로 간주했습니다.

2009~2022
하나의 점은 각 보호자가 해당 월에 유효고액이었음을 의미

 

Y축의 가로 줄 하나마다 한 명의 고객을 나타냅니다. X축은 연도, 그래프 상의 점은 해당 고객이 매출을 일으킨 시점(월 단위)을 표시했습니다.

온라인 서비스에서 고객 사용 패턴은 유입 초기에 많이, 자주 방문하다가 급격히 방문 빈도가 줄어드는 L자형 모델을 상정합니다.

하지만 보시다시피 동물병원 고객들은 MAU는커녕 YAU로도 관리하기 어려운 방문패턴을 보입니다.

이런 고객군을 대상으로 MAU와 단순 리텐션 데이터를 보는 게 정말 의미가 있는 분석일까요?

 

# 떠나간 줄 알았던 고객이 나중에 지갑을 연다

방문뿐만 아니라 매출 발생 분포까지 보면 상황은 더 복잡해집니다.

아래 그림은 2012년 2월부터 12월까지, 최초 내원 당시 반려동물이 1살 미만인 고객만을 월별로 분리해 시간의 흐름에 따라 청구된 진료비의 평균값을 코호트 차트로 시각화 한 것인데요.

(최초 내원 당시 반려동물 간 나이의 차이가 진료비에 미칠 영향을 통제하기 위해 분석대상 반려동물의 연령을 제한했습니다. 동물병원 경영정보 보호를 위해 청구된 진료비와 관련된 구체적인 수치는 표시해드리지 못하는 점 양해 바랍니다)

최초 내원시 반려동물이 1세 미만이었던 경우만 추출
하나의 칸은 각 고객 코호트 그룹이 해당 월에 발생시킨 진료비의 평균을 나타냄

Y축은 해당 고객군이 최초로 내원한 달, X축은 최초 내원 이후 지난 시간 (1개월 단위), 그래프 상의 박스는 해당 시점 내원한 고객들이 발생시킨 진료비의 평균값입니다. 각 박스의 색깔이 진료비의 수준을 나타냅니다. 밝은 색일수록 높죠.

MAU 기준으로 판단하면 이미 병원을 떠났던 고객군이 나중에 (반려동물이 나이가 든 다음) 큰 진료매출을 일으키는 경우가 드물지 않은 일이라는 것을 알 수 있죠.

이렇게 되면 기존의 분석 방법론과 유닛 이코노믹스, 그러니까 MAU와 재방문율을 측정하고, 객단가를 곱해서 기대가치를 계산하고, 그 비용에 맞춰서 마케팅을 집행하는 온라인 전략을 그대로 적용하기 어렵습니다.

 

# 동물병원에선 MAU 개념을 버려야 할까?

그렇다면 역시 분석은 포기하고 최선을 다해 진료한 다음 병원이 잘 되도록 해 달라고 기도하는게 답일까요? 이 문제는 기존 방법론이 가진 수학적인 사상을 약간 수정하면 어느정도 극복할 수 있습니다.

오프라인 고객은 온라인 고객과 달리 분석단위가 되는 시간이 한참 지나고 나서야 다시 방문하는 경향이 있으니, 단위 기간의 고객을 분석할 때 잔류한 고객(Retention), 이탈한 고객(Churn) 뿐만 아니라 MAU 산식상 이탈한 것으로 판정되었지만 나중에 되살아난 부활고객(Revived)을 중요 변수로 포함시켜야 합니다.

간단한 코드 작성을 통해 EMR로부터 동물병원의 매월 총 유효고객수, 그리고 유효고객 가운데 신규/잔류/부활 고객을 구분해 추출할 수 있습니다. 다시 A동물병원의 예를 들면 아래와 같습니다.

(동물병원 경영정보 보호를 위해 고객수 단위는 표시해드리지 못하는 점 양해 바랍니다)

Y축은 고객수, X축은 연도(월별)을 나타냅니다. 그래프는 색깔별로 유효고객수(파랑), 신규고객수(주황), 재방문고객수(초록), 부활고객수(빨강)을 의미하는데요.

우선 다음 몇 가지 패턴을 확인할 수 있습니다.

-동물병원의 신규 고객수(주황색 선)은 시간이 지나도 성장하지 않고 일정한 범위 안에서 유지되는 경향이 있습니다.

-동물병원 전체 유효고객(파랑색 선)의 장기적인 성장을 이끄는 것은 재방문(초록), 그리고 부활고객(빨강)의 성장입니다.

즉, 동물병원 내원객수의 성장은 초기에 얼마나 많은 신규 고객을 모집하느냐가 아니라, 기존 고객을 얼마나 잘 유지할 수 있느냐에 달려 있습니다.

그리고 월별 고객 유입량 가운데 부활고객의 비중이 적지 않은 만큼, 재방문율을 계산할 때도 부활한 고객군을 반드시 고려해야 합니다.

 

# 동물병원 다음달 내원객 수 예측하기

특정 주기로 일정한 양의 신규 고객이 유입되고 그중 일정한 비율의 고객이 이탈하는 서비스의 고객 성장 기대치(한 주기에서 고객 유입량과 이탈량이 동적 평형을 이루는 수준)는 [신규고객수/이탈률]로 알려져 있습니다.

예를 들어, 어느 사업장에 매달 신규 고객이 30명씩 유입되고 전체 고객 중에 50%(0.5)가 매달 이탈한다면, 최종적으로 이 사업장의 매월 총 고객 성장 한계는 30/0.5 = 60명이 됩니다.

하지만 이 모델은 한번 놓친 고객이 되돌아오는 경우가 거의 없는 온라인 서비스 고객분석에 적합한 모델로, 동물병원에 같은 계산식을 대입하게 되면 실제 동물병원의 고객 성장 수치를 매우 하회(저평가)하게 됩니다.

실제로는 시간이 지난 다음 찾아오는 부활 고객도 유입 고객인데, 이 부분을 반영하고 있지 않기 때문입니다.

따라서 월별로 [유입고객수/이탈률], 즉 (당월 신규고객수 + 당월 부활고객수 ) / ( 1 – ( 당월 재방문고객수 / 전월 유효고객수 ) ) 로 계산식을 수정해 그 다음 달의 내원고객수를 근사할 수 있습니다.

이 공식을 통해 예측한 값(주황색 선)과 A동물병원의 실제 데이터(파란색 선)을 나타낸 그래프는 다음과 같습니다.

이때 공식의 월별 오차율 ( |예측값 – 실제값| / 실제값 )은 평균 0.078로, 예측값은 월별로 실제 값과 약 7.8%의 오차를 나타냅니다.

이 공식이 다른 병원 데이터에도 유효하게 적용되는지 확인하기 위해, 데이터 분석에 동의한 B동물병원 EMR에 A동물병원에 적용된 것과 같은 코드를 적용한 결과는 다음과 같습니다.

A동물병원과 마찬가지로 B동물병원에서도 전체적으로 비슷한 교훈을 얻을 수 있습니다.

신규 고객은 시간이 지나도 성장하지 않는다, 내원 고객수의 장기 성장을 견인하는 건 재방문, 부활 고객이다’라는 거죠.

또한, 전월 데이터 기반 예측값이 다른 지역의 동물병원에서도 유효함을 확인할 수 있습니다. B 동물병원에서 공식에 의한 도출된 예측값은 실제 값과 월별로 약 8.2%의 오차를 나타냅니다.

 

# 머신러닝 하면 더 정확하지만..

여기까지 생소한 내용을 살펴보시느라 수고 많으셨습니다. 사실은, 설명드린 내용보다도 다음 달의 내원 고객수를 더 정확하게 예측하는 방법이 있습니다. 바로 기존 EMR 데이터에 머신러닝 모델을 적용하는 방법입니다.

잔류고객, 이탈고객, 부활고객을 모두 변수로 고려하면, 기본적인 다중선형회귀만으로도 다음달 내원객수에 대해 매우 설명력이 높은 모델을 구축할 수 있습니다.

공식에 의한 예측값(상단 그래프, 주황색 선)과 데이터랩에서 구축한 머신러닝 모델의 예측값(하단 그래프, 주황색 선)을 실제 데이터(파란색 선)와 비교해 보면 머신러닝 모델의 예측이 더 우수함을 쉽게 확인할 수 있습니다.

이 모델에서 회귀계수는 0.948에 달하며, 이는 설명변수(당월 신규/재방문/부활고객수)로 구축한 모델이 목적변수(다음 달의 유효고객수)의 변화를 충분히 설명하고 있음을 의미합니다.

그러나 어려운 수리모델이나 프로그래밍 언어를 알아야만 고객분석이 가능하다면, 내용을 설명드린다 해도 진료 현장에 계신 분들께 와 닿지는 않을 거라고 생각합니다.

그래서 현업에서 참고하실 수 있도록 최대한 수의사의 관점에서, 직관적으로 이해가능한 공식 중심으로 데이터에 접근했다는 점 참고 바랍니다.

장래엔 머신러닝 모델을 활용해 더 많은 원장님들과 다양한 데이터분석 프로젝트를 수행할 수 있기를 기대합니다. 감사합니다.

*아이엠디티 데이터랩(iamdt d.LAB)은 벳아너스 얼라이언스의 EMR 데이터와 각종 통계 데이터를 바탕으로 동물병원 경영과 반려동물 산업에 도움이 되는 인사이트를 도출합니다(문의 hyde@iamdt.co.kr).

데일리벳 관리자
Loading...
파일 업로드 중 ...