수의사 선배님들과 사석에서 이야기하다보면 ‘개원가의 경기상황이 수의사 한 명 한 명의 삶에 미치는 영향이 생각보다 컸구나’ 하는 걸 느낄 때가 있습니다.
“2002 월드컵 전후로 동물병원 붐이 일어나면서 공무원 하던 수의사들이 한꺼번에 임상가로 유출돼, 그때 떠나지 않고 자리를 지키고 있던 사람들은 빠르게 승진했다” 라는 이야기라든지 “2008년 즈음엔 세계 금융위기로 경기가 위축되면서 병원들이 어려워지고 주요 일간지엔 버려지는 반려동물이 사회적 문제로 나오기 시작했다”는 이야기처럼 말이죠.
여러 사람들의 견해를 모아 생각해보면, 예전에는 확실히 경제 상황과 임상가의 분위기가 일치했던 것으로 보이는데요. 지금은 상황이 좀 달라진 것 같습니다.
경제 불황에도 성장을 지속하는 분야로 반려동물 산업이 주목받는가 하면, 최근 몇 년 간 봉직수의사의 임금 수준이 빠르게 상승하고 있습니다.
“수도권에는 더 이상 개원할 수 있는 자리가 없다”는 이야기가 예전부터 들려왔지만, 여전히 수도권에는 신규 개원이 지속적으로 이어지고 있죠.
거시적인 경제 상황과 동물병원 경기가 서로 다른 양상을 나타내는 탈동조화(Decoupling) 현상이 실제로 일어나고 있는 걸까요?
아니면 수의사들의 상황 인식이 지나치게 긍정적 혹은 부정적이었던 걸까요?
신규 개원이 지속되면서도 봉직수의사의 임금이 상승하는 현재의 추세는 과연 언제까지 계속될까요?
수의학의 꽃이 임상이라면, 데이터 분석의 꽃은 예측 분석(Predictive Analytics)이라고 할 수 있습니다. 여기서는 우리나라 동물병원 개원 인허가 자료로부터 시계열 모델을 구축해 과거의 전체적인 추세를 살펴보고, 향후 몇 년 간의 예측을 시도해보려고 합니다.
시계열 분석과 Facebook Prophet의 이론적 배경
시계열 분석/예측이란 과거에 시간의 흐름에 따라 기록된 데이터를 분석하고,’ 과거의 데이터 패턴(pattern)이 미래에도 지속적으로 유지된다’는 가정 아래 미래에 대한 예측(forecast)을 하는 것입니다.
주식이나 코인 가격의 장기적 추세를 나타내는 추세선 역시 이동평균법, 지수평활법 등 시계열 분석 방법론을 활용해 도출해낸 것입니다.
시계열 예측은 금융계뿐만 아니라 여러 산업군에서 수요 예측, 재고 관리, 이상 탐지 등에 활용될 수 있지만 실제 활용사례는 그렇게 풍부하지 않습니다.
시계열 데이터/모델 자체가 일반 데이터/모델과는 다른 특수한 성질을 가지고 있어, 특정한 산업군에 대해 전문 지식을 가진 사람이 시계열 데이터/모델링에까지 전문적인 지식을 갖추고 통계 모델을 튜닝해 쓰기는 어렵기 때문입니다.
이런 현업의 문제를 극복하기 위해, 일련의 페이스북 엔지니어들은 전반적인 성능이 우수하고 모델 튜닝이 간편한 Facebook Prophet을 오픈소스 프로젝트로 공개했습니다.
이듬해 열린 세계적인 데이터분석 대회에서 대기 중 미세먼지 농도를 예측하는 문제가 출제되었는데, 몇몇 상위권 랭커들이 날씨 예보 정보를 전혀 사용하지 않고도 과거 시계열 미세먼지 농도와 Prophet만으로 좋은 성적을 거뒀음이 알려지며 분석가들에게 주목받게 되었죠.
Prophet 역시 다른 시계열 모델과 마찬가지로 구성 컴포넌트에 대한 이해와 파라미터 조정을 통한 모델 튜닝이 중요합니다만, 수학적 모델 설명이 본 글의 주제는 아니니 생략하겠습니다.
(Prophet 자체에 대한 원문 설명과 프로젝트 개발자의 견해는 https://peerj.com/preprints/3190.pdf 에서 확인하실 수 있습니다.)
지난 20년간 두 번의 고점과 한 번의 저점이 왔다
동물병원 개업 데이터로부터 시계열 모델을 구축하고 시각화한 결과는 위와 같습니다.
가로축은 연도, 세로축은 당해 새로 개원한 동물병원 개소수를 나타냅니다. 그래프의 검은색 점은 실제 데이터포인트, 파란색 선은 모델이 예측한 값, 하늘색 밴드는 신뢰수준 80%의 예측값 범위를 나타냅니다.
데이터로 볼 때 2002년은 정말로 ‘동물병원 개원 붐’이라는 표현이 적절하다고 느껴질 정도의 상승세를 보여줍니다. 1999년 분기당 50개소 수준이던 신규 동물병원은 불과 4년 뒤인 2003년 초에는 거의 분기당 170개소씩 생겨납니다.
하지만 그 때가 역사적 고점이었습니다. 바로 이듬해인 2004년부터 신규 개원 추세는 반전되어 올라갈 때와 비슷한 경사로 내려갑니다. 세계금융위기가 우리나라를 덮친 2008년 초가 되면 개원 붐이 시작되던 수준인 60개소 선으로 돌아갑니다.
이때 저점을 찍고 다시 추세는 전환됩니다. 이후로 개원은 완만하게 증가하다가, 2017년 두 번째 고점을 찍고 다시 완만한 하향 추세를 보입니다. 그리고 2022년 초 현재 개원은 분기당 70개소 선으로 내려가며 14년 전의 저점에 근접하고 있는 상황입니다.
폐업 데이터의 경우 개업 데이터와 약간의 시간차를 두고 움직입니다.
위 그래프에서 세로축은 당해 폐업한 동물병원 개소수이며, 빨간 화살표는 왼쪽부터 각각 개업 데이터의 고점, 저점을 표시합니다.
개원 증가와 더불어 빠르게 증가하던 폐업은 2006년에 분기당 70개소 수준으로 역사적 고점을 찍고, 상승세보다는 완만하게 하락해 2012년 분기당 35개소 수준으로 저점을 기록한 뒤, 다시 2018년에 분기당 50개소 수준으로 추세상 고점을 기록합니다.
이후로 지속 하락해 분기당 30개소 수준으로 10년 전 저점인 2012년도보다도 낮아지고 있습니다.
특정 기간 개업수에서 폐업수를 빼면 당기 동물병원 개소수의 순증감(Y축)을 볼 수 있는데요. 2003년의 대호황, 2008년을 전후로 한 경제위기를 여전히 확인할 수 있습니다.
개폐업 데이터를 종합해 최근의 추세를 보면, 2014년 이후 개원가는 분기당 40개소 수준의 동물병원 증가가 유지되는 안정적인 추세를 보이고 있습니다.
개업 자체는 서서히 감소하고 있지만 개업 감소세보다도 좀 더 가파른 폐업 감소세가 순증감을 ‘떠받치고 있다’고 해석할 수 있습니다.
시계열 모델은 2024년까지 현재의 안정 추세가 이어질 것으로 본다
과거 데이터로 시계열 모델을 구축하고 나면, 특정 시점의 미래 데이터도 예측할 수 있습니다. 동물병원 개소수 순증감 시계열을 확장해 향후 3년간의 예측을 그리면 아래 그래프와 같습니다.
2021년 4/4분기의 실제 동물병원 순증감수는 37, 모델의 예측값은 38.49620인데요. 이후 2022년 4/4분기 예측값은 37.79060, 2023년 36.85407, 2024년 35.91498로 나타나며 신뢰구간의 상하한선 역시 각각 65, 10 수준에서 크게 발산하지 않습니다.
즉, 시계열 모델은 현재의 안정 추세가 당분간 계속될 것으로 보고 있습니다.
동물병원 인접 산업군의 상황은
그렇다면 동물병원 인접 산업군의 상황은 어떨까요? 동물병원과 마찬가지로 동물판매업, 동물미용업, 동물약국의 기간별 순증감 시계열 자료를 추출해 향후 3년간의 추세를 예측한 결과는 다음과 같습니다.
우선 동물약국입니다.
동물약국 데이터에서는 2004년의 일시적인 동물약국 붐을 확인할 수 있고, 2013년 수의사처방제 시행 및 수의사-약사 직역간 갈등양상 이후 동물약국 개소수 순증 추세가 더욱 가속되고 있음을 확인할 수 있습니다.
우리나라에서 영업중인 동물약국 개소수는 2018년경 이미 동물병원 개소수를 추월(>4800)했으며, 2024년까지 더욱 늘어날 것으로 예상됩니다.
다음은 동물판매업입니다.
2008년 동물보호법상 동물판매업 등록제가 시행된 이후, 2012년까지 성장세를 보이다가 이후로 성장세가 둔화되었습니다.
2016년을 분기로 추세 반전해 2019년 이후 일부 구간에서는 영업중인 사업체 수가 감소하는 등의 부침을 겪고 있습니다.
현재 추세가 이어질 경우 동물판매업은 2023년 이후 마이너스 성장을 기록할 것으로 보입니다.
동물미용업의 경우 비교적 최근인 2018년부터 동물관련영업에 동물미용업이 신설된 이후 지속 하락세를 나타내고 있습니다.
가용데이터 제한으로 인해 예측치의 신뢰구간이 발산하고 있어 조심스럽지만, 2024년경 동물미용업장의 증가 수준은 2020년의 절반이 될 것으로 보입니다.
* * * *
본 분석의 목적은 ‘내년도 1/4분기 동물병원 개원 숫자를 오차없이 예측하겠다’가 아니라 ‘시계열 모델링을 동물병원 관련 데이터에 이렇게 활용해볼 수도 있다’인 만큼, 예측 결과는 가벼운 마음으로 참고해 주시길 바랍니다.
원자료로는 [행정안전부 지방행정인허가데이터셋]을 활용했으며, 전처리 방법과 모델 튜닝의 세부사항에 따라 예측 결과 및 성능은 다르게 나타날 수 있습니다. 감사합니다.
<동물병원의 포화 규모와 포화 시점을 예측하는 하편으로 이어집니다-편집자주>
*아이엠디티 데이터랩(iamdt d.LAB)은 벳아너스 얼라이언스의 EMR 데이터와 각종 통계 데이터를 바탕으로 동물병원 경영과 반려동물 산업에 도움이 되는 인사이트를 도출합니다(문의 hyde@iamdt.co.kr).