모든 상수도망은 누수의 위험성을 안고 있으며, 원인이 다양하여 파악이 어렵습니다. 노후화된 기반시설, 적절한 유지보수 미시행, 압력 변화, 땅에 묻힌 수도관을 부식시키는 토양 등 다양한 원인이 복합적으로 작용하여 누수가 발생합니다. 이로 인해 수자원 손실 뿐 아니라 고객 불만족, 재정 손실, 시설 문제가 야기되며, 더 나아가 침식까지 일으킬 수 있습니다. 따라서 피해를 최소화하기 위해 누수의 위치를 정확히 파악하고, 발생 시기와 원인을 이해하는 것이 매우 중요합니다.
본 글에서는 ArcGIS GeoAnalytics Server를 활용한 데이터 분석을 통해 상수도 누수 관리 과정을 보여드리고자 합니다. 누수가 발생한 지점 및 시기를 파악하고, 그 정보를 활용하여 특정 지역의 누수 발생 원인을 찾아보겠습니다.
미국 테네시 주 최대 상하수도 관리 본부 중 하나인 White House Utility District (이하WHUD)는 90,000명 이상의 주민들에게 깨끗하고 안전한 식수를 제공하고 있습니다. ArcGIS GeoAnalytics Server를 활용하여 지난 14년동안 WHUD가 누적한 작업 지시 및 서비스 요청에 대한 데이터를 분석해보겠습니다.
분석에 사용할 WHUD의 14년간 데이터 규모은 ArcGIS GeoAnalytics Server를 활용하여 분석하기 적합한 데이터 양이며, 더 큰 용량의 데이터 세트와 결합하여 추가 분석을 수행하기에도 알맞은 정도입니다.
이제 분석을 시작해보겠습니다. WHUD에 누적된 서비스 요청 내역 원본 데이터를 지도 위에 올리면 아래와 같이 나타납니다.
지도상에 무수히 많은 파란 점이 생겼지만 시간의 흐름에 관계 없이 중첩되어 있습니다. 각 포인트들은 누수 보고 시기와 작업 지시 개시 및 완료에 대한 중요한 정보를 포함하고 있습니다.
Work Flow # 1
우리가 수행할 첫 번째 분석은 작업 지시 내역을 모두 가져와서 시간과 공간에 따라 3D로 시각화하는 것입니다. 복잡해 보일 수 있지만 ArcGIS GeoAnalytics Server 도구인 Create Space Time Cube를 사용하면 간단합니다. 분석은 GeoAnalytics Server에서 실행되며, ArcGIS Pro는 클라이언트 서버로 사용합니다.
먼저 서비스 요청 지도를 가져와서 Create Space Time Cube Parameter (매개 변수)에 다음을 추가합니다.
각 항목을 다음과 같이 지정합니다.
- Output Name: 산출물 이름
- Distance Interval: 사각 막대의 크기 (거리 간격)
- Time Interval: 시간 간격
- Time Interval Alignment & Reference Time (시간 간격 정렬 및 참조 시간)
또한 각 시공간 도형에 계산하려는 요약 통계를 포함시킬 수 있습니다. 이 경우 요약 필드를 공백으로 두고 각 도형 범위 안의 포인트 수를 계산하면 됩니다. 혹은 0이나 공백 평균값 또는 다른 알고리즘으로 빈 도형을 채울 수 있으며, 작업 지시의 평균 수 또는 최대/최소와 같은 도형에 대한 통계를 계산할 수 있습니다.
우리가 분석할 WHUD의 데이터 세트는 크기가 작은 편이므로 작업 지시 건수를 계산해보겠습니다. 이 도구의 입력에 대한 자세한 내용은 syntax 의 ‘Create Space Time Cube’ 문서에서 확인할 수 있습니다.
매개 변수는 3000 피트에서 시작하여 최대 3,000 피트 높이로 각 집계 도형의 크기를 결정하고, 2004년 4 월부터 현재까지 6개월 단위의 덩어리로 나눠보겠습니다. 데이터는 과거 내역을 포함하기 때문에 분석에 있어 ‘시간’을 사용하는 것은 중요합니다.
이 Create Space Time Cube 분석에는 약 30초가 소요되며, 완료되면 결과 netCDF 파일을 가져와 ArcGIS Pro의 지오프로그레싱(geoprocessing) 도구인 Visualize Space Time Cube in 3D를 사용하여 결과를 시각화합니다. 결과는 막대 도형의 정렬 형태로 표시됩니다.
흥미롭게 보이지만, 의미 있는 지도라고 보기에는 아직 부족합니다. 그래서 6개월 동안 누수가 4 회 이상 보고 된 막대를 필터링하여 결과를 구체화 해보려고 합니다. 이렇게 하면 누수가 발생했음에도 불구하고 작업 지시가 없던 지역을 구별할 수 있습니다.
이 작업은 정의 쿼리를 사용하여 수행 할 수 있습니다. 정의 쿼리가 적용되면 막대 도형의 높이가 훨씬 줄어들지만, 각 구역의 시간과 공간에 대한 위치는 유지하고 있습니다.
각 도형의 색상은 누수 빈도를 나타내며 색이 어두울수록 누수가 빈번히 보고된 지역입니다. 데이터를 필터링하여 누수가 더 많이 발생했던 특정 위치도 살펴 볼 수 있습니다. 또한 막대를 클릭하여 해당 지역에서 6개월 동안 발생한 누수가 몇 건인지 확인할 수 있습니다. 아래 막대의 경우 2013년 10월 5일 ~ 2014년 4월 5일 사이에 총 10번의 누수가 발생했음을 알 수 있습니다.
이 분석을 통해 해당 지역의 누수가 언제 어디에서 얼마나 자주 보고되었는지 알 수 있습니다. 뿐만 아니라 이러한 데이터를 브라우저 기반 시각화 및 데이터 탐색을 위한 웹 레이어 형태로 ArcGIS Enterprise에 공유할 수 있습니다. 아래의 스크린 샷을 통해 Enterprise Portal에서 데이터가 어떻게 렌더링되는지 확인할 수 있습니다. 이제 웹을 통해 다른 관계자들과 쉽게 분석 결과를 공유할 수 있으며, 관리가 필요한 구역을 자세히 파악할 수 있습니다.
1차 분석이 완료되었습니다. 그러나 여기서 한발 나아가 더 많은 인사이트를 찾아낼 수 있습니다. 누수가 증가하거나 감소하는 지역은 어디일까요? 누수 발생 현황은 어떻게 될까요? 데이터 분석으로 공통적인 패턴을 파악하여 미래 피해를 예측하고 예방할 수 있습니다.
Work Flow # 2
위의 질문에 대한 답변을 찾기 위해 ArcGIS Pro에서 Emerging Hot Spots 도구를 실행해보겠습니다. Emerging Hot Spots 도구는 ArcGIS GeoAnalytics Server 도구는 아니지만 GeoAnalytics를 사용하여 Emerging Hot Spots 에 반영할 Create Space Time Cube 분석을 실행합니다.
Emerging Hot Spots 은 누수가 지속적으로 보고된 지역과 누수가 증가한 지역, 누수 발생이 상대적으로 적은 지역 등을 파악할 수 있도록 하는 시각적 도구입니다. 수동으로 조사할 필요 없이 Create Space Time Cube 분석을 통해 시간 경과에 따른 변화를 고려하여 추측할 수 있는 좋은 방법입니다. 아래에서 그 분석 결과를 볼 수 있습니다. (이는 ArcGIS Pro 도구와 GeoAnalytics 도구를 어떻게 사용하는지 보여주는 예이기도 합니다. 빅데이터를 줄이거나 집계하여 다른 분석에 사용하기 위해 GeoAnalytics를 사용하는 일반적인 과정입니다. )
Emerging Hot Spots 분석을 실행해보니, 가운데 눈에 띄는 ‘Intensifying Hot Spots’ (지도 중간의 밝은 빨간색 사각형)이 드러났습니다. 이 결과는 흥미롭습니다. 핫스팟 및 주변 지역이 새로운 개발과 인프라 구축이 이뤄지는 곳이기 때문입니다. 이 지역에 이전보다 누수가 많이 발생하기 때문에 기술자를 파견하여 감시해야 한다는 사실을 알 수 있습니다.
Workflow # 3
마지막 데이터 분석을 해보겠습니다. 상수도 본관과 부관이 있습니다. 이 데이터 세트에는 물을 운반하는 파이프와 직경, 설치 날짜 및 토양 부식성과 같은 많은 정보가 담겨 있습니다. 앞서 말한 것처럼, 토양 부식성은 상수도 시설을 약화시켜 누수를 야기할 수 있기 때문에 중요합니다.
다음으로는 부식이 심한 파이프 근처에 누수가 발생한 곳이 있는지 분석해보겠습니다. 이 분석에는 GeoAnalytics Server를 사용하여 ArcGIS Pro에서 실행되는 Join Features 라고 불리는 도구를 사용할 것입니다.
도구 매개 변수에 다음을 입력합니다.
누수 데이터 세트를 대상 레이어로 선택하고 (공간적 근접성을 기반으로) 합쳐질 레이어로 상수도 본관을 선택합니다. 상수도 본관 해당 구역으로부터 500 피트(약 152미터) 이내에 있는 모든 누수를 탐지해보겠습니다.
이 두 가지 데이터 세트를 합치면 결과 레이어는 ‘본관 500 피트 이내의 누수와 본관 세부 사항 (부식 정보 포함)’을 모두 포함합니다. 본관의 500 피트 이내에서 발생한 누수만 표시되므로, 토양 상태로 인해 발생한 누수 탐지를 위해 데이터를 추가로 필터링할 수 있습니다.
누수와 수도관 정보가 하나의 데이터 세트로 합쳐졌습니다. 누수 발생 포인트를 클릭하면 누수가 부식성 토양에 위치한 급수관 근처에서 발생했다는 것을 알 수 있습니다. 뿐만 아니라 부식된 토양에 묻힌 상수관을 따라 다른 어느 지점에서 추가 누수가 발생할지를 예측하고, 앞서 실행한 시공간 분석 및 핫스팟 분석을 활용해 상수관 교체 일정을 세울 수 있습니다.
상수도 누수 관리를 위해 많은 양의 복잡한 데이터를 다양한 방법으로 신속하게 처리할 수 있는 ArcGIS GeoAnalytics Server를 활용하였으며, 누수탐지 및 예측은 하나의 예에 불과합니다.
점점 더 많은 조직이 막대한 양의 데이터를 신속하게 처리, 분석하고 이해할 필요성을 깨닫고 있으며, 단순히 데이터를 보유하는 게 아니라 고객 데이터, IoT 센서, 동적 자산, 주요 정보 등 다양한 형태의 데이터가 지닌 의미를 파악하여 업무에 활용하고 있습니다.
ArcGIS Enterprise에서 빅데이터 분석을 수행하는 ArcGIS GeoAnalytics Server는 분산 컴퓨팅으로 데이터 처리 시간을 단축해 신속한 분석 수행이 가능합니다. 함께 제공되는 도구 모음을 활용하여 대규모 데이터 세트의 패턴을 집계, 요약, 검색하는데 사용할 수 있습니다. 또한, 회귀 분석 및 예측 도구, 클러스터링, 집계 및 유용한 데이터 관리 도구를 비롯하여 워크플로우를 기반으로 사용할 수 있는 많은 알고리즘을 제공합니다.
데이터와 적절한 분석 툴을 활용하여 과학적이고 효율적인 상수도망을 관리함으로써, 누수를 예방하고 피해를 최소화 할 수 있습니다.
본 내용에 대한 문의사항은 water@esrikr.com 혹은 02-2086-1906으로 연락 주시기 바랍니다.