Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1225-7672(Print)
ISSN : 2287-822X(Online)
Journal of the Korean Society of Water and Wastewater Vol.33 No.2 pp.151-158
DOI : https://doi.org/10.11001/jksww.2019.33.2.151

Real-time monitoring sensor displacement for illicit discharge of wastewater: identification of hotspot using the self-organizing maps (SOMs)

Seong-Nam Nam, Sunghoon Lee, Jungryul Kim, Jaehyun Lee, Jeill Oh*
Department of Civil and Environmental Engineering, Chung-Ang University, 84, Heukseok-ro, Dongjak-gu, Seoul, Republic of Korea, 06974
Corresponding author: Jeill Oh (E-mail: ohjeill@cau.ac.kr)
19/12/2018 08/04/2019 09/04/2019

Abstract


Objectives of this study were to identify the hotspot for displacement of the on-line water quality sensors, in order to detect illicit discharge of untreated wastewater. A total of twenty-six water quality parameters were measured in sewer networks of the industrial complex located in Daejeon city as a test-bed site of this study. For the water qualities measured on a daily basis by 2-hour interval, the self-organizing maps(SOMs), one of the artificial neural networks(ANNs), were applied to classify the catchments to the clusters in accordance with patterns of water qualities discharged, and to determine the hotspot for priority sensor allocation in the study. The results revealed that the catchments were classified into four clusters in terms of extent of water qualities, in which the grouping were validated by the Euclidean distance and Davies-Bouldin index. Of the on-line sensors, total organic carbon(TOC) sensor, selected to be suitable for organic pollutants monitoring, would be effective to be allocated in D and a part of E catchments. Pb sensor, of heavy metals, would be suitable to be displaced in A and a part of B catchments.



폐수의 무단 방류 모니터링을 위한 센서배치 우선지역 결정: 자기조직화지도 인공신경망의 적용

남 성남, 이 성훈, 김 정률, 이 재현, 오 재일*
중앙대학교, 사회시스템공학부 건설환경공학과, 서울특별시 동작구 흑석로 84, 06974

초록


    Ministry of Environment
    2016000200012

    1. 서 론

    산업폐수, 가축분뇨 등의 무단방류 및 부적정 처리 로 인하여 하천의 물고기가 떼죽음을 당하거나, 악취 에 의한 민원 증가, 오염된 토양의 무단 투기나 방치 로 인한 주변 하천과 지하수, 토양에의 심각한 오염이 초래되기도 한다. 이와 같은 부적정 보관·처리에 따른 무단 방류 감시 및 악취 발생, 환경 오염사고의 예방 을 위하여 주기적으로 배출시설에 대한 지도/점검을 실시하고 있으나, 인력 및 자원이 부족한 현실에서 갈 수록 지능화되어가는 무단방류 행위를 적재 적시에 단속하기에는 어려움이 있다. 따라서, 의도적인 무단 방류나 비의도적인 오염물질 유출과 같은 오염사고를 감지하기 위해 센서의 최적 위치를 결정하기 위하여 유전알고리즘(generic algorithm, GA)이나 인공신경망 (artificial neural networks, ANNs) 기법, 엔트로피 (entropy) 이론 등을 적용하여 배출오염원을 추적하기 위한 연구가 활발히 진행되고 있다(paik et al., 2011;Banik et al., 2014). 이들 연구는 대부분 관망 내에 흐 르는 유량이나 유량변화로 인한 압력의 변화 혹은 정 보용량의 변화를 감지하여 배출원이나 센서 위치를 결정하는 방법으로, 오염물질의 농도 혹은 소량으로 도 환경유해성은 매우 높은 오염물질의 배출이 발생 하는 경우, 유량 변화에 기반한 정보의 변화를 계측하 고 감지하는데 한계가 있을 수 있다. 특히, 오염물질 의 무단 방류로 인한 환경피해는 궁극적으로 오염물 질의 배출 부하량의 관점에서 평가되는 것이 바람직 하다고 판단되며, 유량의 측정과 더불어 수질 혹은 특 정오염물질에 대한 배출패턴을 모니터링하는 것이 정 확한 무단방류 감지를 위해 중요한 과정이다. 대개, 무단방류가 발생하는 지역은 간헐적이나 반복적이며, 특정 오염물질의 농도가 높은 경우도 많다. 따라서, 무단방류를 효과적으로 모니터링하기 위하여 감시대 상 지역의 수질오염물질의 배출패턴을 파악하고, 수 질 오염물질 인자 중심의 위험분구(hotspot)를 분류하 여 필요한 센서를 설치하는 것이 필요하다. 따라서, 이 연구의 목적은, 미처리된 유해폐수나 오수 등의 무 단 방류의 감지를 위한 모니터링 센서의 우선배치 지 점을 결정하기 위하여, 자기조직화지도(self-organizing map, SOM)기법을 적용하여 배출 수질의 패턴을 분석 하고 우선 배치 지점을 지정하는 것이다.

    자기조직화지도기법은 비지도학습 인공신경망 (unsupervised artificial neural network)기법의 하나로, 자 율학습에 의한 클러스터링(clustering)을 수행하는 알고 리즘이다(Kohonen, 2001). 다차원의 자료 혹은 불규칙 한 자료를 2차원으로 사상(projection mapping)하여 클러 스터링하며, 입력자료의 수가 많아도 단 시간내에 양질 의 결과 획득이 가능하다. 또한, 다중 인자(multiple parameters)에 대한 정보 해석 및 인자들간의 상관성을 규명하고 이를 시각적 이미지화하여 구현하여 줌으로 써 다양한 분야에서 활용되고 있다(Kohler et al., 2009;Mekler and Schwarz., 2014;Nam et al., 2015). SOM은 2개의 레이어, 즉 자료를 입력받는 레이어와 계산된 자 료결과를 보여주는 출력레이어로 구성되며, 각 레이어 는 뉴런(노드)이라는 계산단위체로 이루어진다. 입력레 이어(input layer)와 출력레이어(output layer)는 연결강도 (weight, 가중치)의 값으로 연결되며, 이 연결강도는 모 든 주어진 자료에 대하여 반복적인 계산과정, 즉 학습과 정을 거치면서 수정/조절된다. 학습과정은 주어진 자료 를 SOM에 반복 입력하여 입력레이어와 출력레이어 사 이의 연결강도가 입력자료의 정보특성을 반영하도록 하는 과정이며, 데이터 사이의 상호관계는 유클리디안 거리(Euclidean distance)로부터 결정된다. 입력자료의 정보특성을 효율적으로 시각화하기 위하여 2차원의 격 자에 N개의 출력뉴런이 나타나게, 가로와 세로 방향으 로 최적의 배열로 구성된 격자를 사용한다. 대개 육각 형의 격자를 사용하며, 선택된 출력뉴런의 개수(n)는 규정화된 원칙은 없으나 일반적으로 의 기준을 적용하 여 결정한다 (Vesanto and Alhoniemi, 2000;Bedoya et al., 2011). 입력자료에 대한 SOM 알고리즘의 수행절차는 다음과 같이 6단계로 구분하여 설명될 수 있다 (Kohonen, 2001).

    • 단계 1: 뉴런의 숫자와 지도의 형태 정의를 정의 한다. 뉴런의 수는 일반적인 지도화와 주변 뉴런 과의 크기 조정을 완만하게 할 수 있도록 가능한 충분히 큰 수를 선택한다.

    • 단계 2: 연결강도, 즉 가중치(w)를 무작위의 작은 값으로 초기화한다.

    • 단계 3: 연결강도를 변경시킬 범위(r)을 설정하고, 학습률(η)를 결정한다.

    • 단계 4: 입력벡터 X 선택하고, 유사도, 즉 거리(D) 를 계산하고, 승자뉴런 중 D가 가장 작은 뉴런, 즉, best matching unit (BMU, mc)을 선택한다.

    여기서, ǁ ǁ는 유클리디안 거리(Euclidean distance), c는 BMU인 승자뉴런, 입력벡터 X와 가장 유사한 가 중치로 정의하고, 입력벡터와의 유사성은 전형적인 유클리디안의 거리를 통해 정의한다.

    • 단계 5: mc(t)와 Nc(t)을 정의한다.

    여기서, η(t)는 학습률(learning rate)로서 스칼라 값 이며, 0 ≦ η(t) ≦ 1의 범위를 가지며, 일반적인 값 은 0.2~0.5이다. Nc(t)는 승자뉴런 c에 이웃한 뉴런들의 집합을 나타낸다. mc(t)와 Nc(t)는 뉴런의 거의 절반 이 상을 포함하며, iteration이 반복될수록 포함되는 뉴런 의 수는 감소하게된다.

    • 단계 6: 규정된 반복횟수만큼 학습이 진행되면 r 과 η를 감소시킨 다음 학습과정을 반복하면서, 이 웃함수를 다시 조정(update)한다. 지도의 변화가 없거나 최대 반복수에 이르면 중지하고, 가중치와 입력값 사이의 거리가 최소(Dmin)로 가장 잘 매칭 되는 뉴런을 최종 선택한다.

    2. 연구방법

    2.1 대상지역 현황조사

    폐수 무단방류의 실시간 모니터링을 위한 대상 지 역으로 대전 소재 대덕산업단지 내 일부 지역을 선택 하였다. 대상 지역 내 입주된 44개 폐수배출사업장에 대하여, 각 업체들을 한국표준산업분류에 따라 업종 별로 분류하고, 주요 생산품, 폐수배출(신고)량, 업종 에 따른 폐수 내 주요 배출(예상)오염물질을 정리하여 배출원에 대한 현황을 조사하였다. 또한, 대상 지역내 의 지하 관망도를 확보하여, 관로에 대한 물리적 정보 (관경, 재질, 경사, GIS 기반의 맨홀과 연결관에 대한 위치정보 등), 각 사업장에서 폐수가 배출되는 관망번 호 및 연결관의 위치를 확인하고, 데이터베이스화하 였다 (Fig. 1).

    2.2 수질모니터링 및 분석

    대상지역에 대한 배출원 현황 및 폐수배출 관망도 에 기초하여, Fig. 1 (a)와 같이 다섯 구역(A~E)으로 모니터링 지점을 구역화하였으며, 이 중 12개 지점을 선정하여, 24시간동안 매 2시간 간격으로 채수하여 총 26종(pH, 전기전도도, 부유물질, CODCr, TN, TP, TOC, UV254, SUVA (Specific UV Absorbance, 대개 254 nm에 서 측정된 값을 사용), 중금속류 17종)에 대한 유/무기 성 수질을 분석하였다(Table 1). 수질항목의 분석은 수 질오염공정시험법과 AWWA의 standard methods (21st edition)를 따라 수행되었다.

    2.3 데이터분석

    SOM분석은 수질분석을 통해 얻은 3,704 elements (26개 변수, 144개 시료) dataset에 대하여 수행하였으며, MATLAB 2017b (Mathworks Inc., USA) 환경에서SOM toolbox 2.0 (http://www.cis.hut.fi/projects/somtoolbox)를 이 용하였다. 선택된 출력 뉴런의 개수는 60(n=12×5)개의 육각형 격자를 사용하였으며, 최대 반복횟수는 1,000, 학습률은 0.5로 실행하였다. 각 수질의 인자별 배출농도 의 단위에 차이가 있어 로그변환하여 자기조직화지도 의 입력층에 할당하였다. 그 외, 통계분석은 SPSS 25.0 패키지를 사용하였다.

    3. 결과 및 고찰

    3.1 폐수의 수질분석

    Table 1은 대상 지역내에서 배출되는 폐수에 대한 모니터링 항목별 mean, range, coefficient of variation (CV)를 정리한 표이다. Table 1에서 보는 바와 같이 대상 지역내에서 측정된 수질 인자들의 배출은 각 인 자별로 농도의 범위, 편차 및 변동계수(CV)가 매우 달 랐으며, 이는 다양한 업종들이 혼재한 산업단지내에 서 배출되는 폐수의 시공간적 변동성이 큰 때문인 것 으로 판단된다. 배출농도의 범위의 경우, 검출이 되지 않는 수준의 낮은 범위에서 수~수십 ppm정도까지의 높은 농도까지 검출되기도 하였는데, 이는 간헐적으 로 발생하는 무단 방류의 경우, 적시에 모니터링하여 감지하는 것이 어려우며, 실시간 모니터링을 통한 감 시체계 구축이 필요함을 방증한다고 볼 수 있다.

    3.2 SOM clustering

    대상 지역에서 배출되는 폐수에 대한 수질모니터링 결과를 바탕으로 특정수질과 배출분구간의 연관성이 나 배출 패턴 여부를 파악하기 위해 수질모니터링 자 료를 지점 및 시간에 따라 정리하여 144 × 26 형태의 matrix로 준비하였고, 데이터의 변환없이 matlab에서 loading하였다. 12개 모니터링 지점별 26개 수질 모니 터링 결과를 이용하여 도출된 데이터의 벡터정보가 축약된 SOM 평면지도(U-Matrix)를 추출하여 나타낸 결과이며, 이 연구에서는 12 neurons × 5 neurons 으로 구성된 map으로 표현하였다. 출력 뉴런(map)의 크기 는 휴리스틱 규칙(heuristic rule)에 의해 선택되며 (Vesanto and Alhoniemi, 2000), 입력되는 데이터의 수 가 144개인 이 연구에서는 60개의 출력 뉴런이 최적 으로 결정된다. , 여기서는 몇개의 뉴런이 가장 정확 한지 판단할 수 없으므로 경험적으로 제시된 을 따 라 뉴런의 수를 일차적으로 결정하며, 최적의 뉴런의 수는 학습과정을 통해 도출되는 판단값들(예, mqe, qte)을 참조하여 뉴런의 수를 최종 결정하게 된다. 앞 서 언급한 바와 같이 각 모니터링 지점 SOM의 학습 과정을 거쳐 도출된 결과 map의 mean quantization error (mqe)는 1.680 이었으며, quantitative topographical error (qte)는 0.007 이었다. Quantization error(양자오차) 는 각 입력벡터들과 그것들의 최적매칭벡터들간의 평 균거리를 의미하고, topographic error(위상관계오차)는, 2위의 승자노드가 이웃노드 범위 안에 포함되는 정도 를 보여준다. MQE와 QTE는 SOM모형의 성능을 평가 하는 척도로 사용되며, 두 항의 값이 최소인 모형을 선택하는 것이 일반적이다. Table 2에 나타난 바와 같 이 8가지 배열 중에서 QTE값이 가장 작은 출력모형 으로 12 × 5 map을 선택하였다.

    Fig. 2은 자기조직화지도의 자율학습 후, 각 뉴런이 갖는 유사성을 이용하여 분류한 K-mean 클러스터링 결과를 나타낸다. 뉴런의 거리는 Euclidean distance 에 의해, 그룹의 분류는 Ward linkage 방법을 이용하였 다. U-matrix (Fig. 2 (a))에서 보는 바와 같이 수질 모 니터링 결과는 4개의 그룹(I, II, III, IV)으로 나눌 수 있었으며, 생성된 분류 클러스터는 Fig. 2 (a)로 나타 내었다. Fig. 2 (b)는 각각 그룹별로 144개 시료들이 위치하고 있는 뉴런을 표현하고 있으며, Fig. 2 (c)는 SOM map의 뉴런의 위치에 일치하는 4개의 cluster에 대한 dendrogram을 나타낸다. 최적의 클러스터의 개 수는 클러스터링을 통해 얼마나 전체 데이터가 가진 정보를 양적 및 속성(형태)적으로 잘 담고 있는지를 평가하는 평가지표 중의 하나인, Davies-Bouldin Index (DBI)로 측정하여(Davies and Bouldin, 1979), DBI 값이 가장 작은 4개 clustering이 테스트베드의 수질의 배출 패턴을 분류하는데 적합한 것으로 나타 났다 (Fig. 3).

    Fig. 4는 테스트베드에서 측정된 수질오염물질별 배 출 패턴을 SOM의 형태로 나타낸 것이다. SOM 지도 에서 나타난 바와 같이 배출패턴이 유사한 형태를 보 인 것은 pH, Conductivity, TOC, DOC와 같은 유기물 특성 수질인자는 아래쪽 우측 방향에서 가장 높게 나 타남을 알 수 있으며, 이는 네 번의 모니터링 중 세번 째 조사시기의 지점 2와 조사지점 3지점이 연관된 D 분구(화학업종, 자동차 부품류 제조업체 위치)의 수질 패턴으로 분류되며, cluster III에 해당된다. SS, COD, TP, SUVA 등의 수질인자는 위쪽 우측 방향에 위치한 시료들에게 높게 나타나는 유사성을 보였으며, cluster IV로 분류된 A와 B분구에 위치한 업체들에서 배출되 는 폐수의 수질 패턴으로 판단된다. TN은 테스트베드 내에서 전반적으로 배출 패턴이 유사하였으나, 특히 cluster I에 해당하는 C분구(분구내 식품제조 및 가공 업체 위치)에서 높은 배출을 보였으며, E분구에서는 비교적 낮은 패턴을 보였다. 유기물 수질인자의 배출 패턴별로 분류된 SOM 지도를 볼때 가로의 방향은 유 기물질의 농도(왼쪽에서 오른쪽으로 갈수록 높음)인 것으로 판단된다. 흥미로운 것은, 유기물질 농도에 의 한 클러스터링에서 TOC (혹은 DOC)와 COD 결과에 서의 배출패턴이 다르게 나타난 것인데, 일간 모니터 링 결과를 통해 정확한 원인을 알 수는 없으나, COD 를 통한 유기물질의 양을 측정시 본 연구에서 측정하 지 않은 방해 물질(예, 염소이온, 중금속류 등)의 영향 때문이 아닌가 추측된다(가령, 동일 시간대 배출된 폐 수내, TOC의 완전연소산화에는 영향을 주지 않으나, COD 산화반응에 영향을 주는 물질이 공존하는 경우). 산업폐수의 배출 패턴이 업종별, 혹은 하루 중에도 시 간대별로 상이하게 다르다는 것을 고려할 때 중-장기 적인 모니터링을 통하여 정확한 배출 농도 및 부하량 패턴을 파악하는 것이 필요하다.

    중금속 및 무기물질의 농도에 관한 U-matrix결과는 pH가 낮은 폐수를 배출하는 지점에서 중금속의 농도 가 높게 나타났으며, As, Cr, Cu의 배출패턴은 TOC, DOC와 같은 유기물 높았던 분구와 유사한 cluster에 분류되었다. 한편, 그 외의 다수의 중금속 및 무기물 질류(Ba, Cd, Fe, Mn, Pb, Sr, Zn)는 오른쪽 우측에 위 치한 cluster IV에서 높은 배출패턴을 보였으며, 기계/ 금속 부품관련 제조업체들이 위치한 A와 B분구의 특 성이 반영된 수질인 것으로 판단된다. Se은 다른 무기 물질들과는 조금 다르게, cluster III으로 분류되었으며, 이는 E분구에 해당된다. E분구에 위치한 업체들 중, 다른 업체들에서는 배출하는 않는 Se과 관련된 물질 을 취급/배출하는 업체나 혹은 제조공정이 있기 때문 인 것으로 추측된다.

    3.3 센서의 우선배치지역 결정

    폐수의 무단 방류를 감지하기 위한 센서의 종류로 유기물질에 대해서는 TOC를, 중금속류의 대표로는 배출원의 문헌조사를 통해 산업폐수에서 가장 많이 검 출되고 있는 중금속류인 Pb이나 Zn로 정하고, 이들 인 자들을 모니터링 할 수 있는 센서의 위치를 결정하고자 하였다. TOC의 배출패턴에 대한 SOM 신경망분석의 결과(Fig. 5), TOC가 높은 폐수를 배출하는 지역은 D 분구와 E분구의 일부가 TOC hotspot에 해당하였으며, 센서의 설치는 3-3 혹은 4-3 지점의 인근 관망에 적합 할 것으로 판단된다. 한편, Pb나 이와 유사한 배출패 턴을 갖는 고농도 중금속류의 함유 폐수의 무단 방류 의 감지를 위한 센싱을 위한 위험지역은 A분구와 B 분구 일부지역에서 높았으며, 모니터링 지점 2-1과 2-2가 위치한 관망에 센서가 설치되는 것이 효과적일 것이라 판단된다.

    4. 결 론

    이 연구는 산업단지 및 공공하수관로 시스템으로 배출되는 미처리/부적정 처리 오폐수의 무단방류를 실시간 감시하기 위한 실시간 센서의 설치 지점을 결 정하기 위하여 수행되었다. 대전에 위치한 산업단지를 시범대상지역으로 연구하였으며, 12개 지점에 대한 26 개 수질항목 모니터링 결과을 활용하여 인공신경망 기 법(자기조직화지도)을 적용한 수질배출 패턴에 따라 대 상지역을 클러스터링 한 결과는 다음과 같다.

    자기조직화 기법에 의해 대상지역의 수질배출패턴 결과에 따라 4개(very high, high, moderate, low) 등급 으로 대상지역이 나누어 질 수 있었다.

    수질 모니터링 인자 중 유기물 배출의 지표로서 TOC가 적합하고, pH 및 conductivity와 같은 범용 센 서에 의해 대체될 수 있다.

    대상 지역 내, 실시간 on-line TOC 수질 센서 설치 를 위한 hotspot으로는 D분구와 E분구 일부가 가장 적 합한 것으로 판단된다.

    다수의 중금속류 모니터링을 위한 센서는 모니터링 지점 2-1과 2-2가 위치한 관망에 설치하는 것이 효과 적일 것으로 판단된다.

    이 연구는 수질센서의 최적 배치를 위하여 넓은 지 역에서 배출되는 수질의 배출 특성의 패턴 분석을 통 하여 위험지역을 결정하는 하나의 방법을 적용한 것 으로, 무단 방류 오염사고의 발생 특성(불규칙성 혹은 불연속성 등)을 고려할 때, 결과의 신뢰성을 제고하기 위하여 일간 수질 변화의 이상의 중-장기적인 수질 및 유량의 배출패턴을 파악하는 것이 필요하다.

    사 사

    이 연구는 환경부와 환경산업기술원의 “환경정책기 반공공기술개발사업 (과제번호 2016000200012)”으로 지원받은 과제입니다. 이에 감사드립니다.

    Figure

    JKSWW-33-2-151_F1.gif

    Simplified view of study area and its clustering (a), and map of sewer network in the test-bed site.

    JKSWW-33-2-151_F2.gif

    (a) U-matrix, (b) location of 144 samples on clustered SOM map, and (c) clusters of neurons identified based on hierarchical cluster analysis with the Ward linkage method using Euclidean distance.

    JKSWW-33-2-151_F3.gif

    Davies-Bouldin Index for 2 to 8 clusters.

    JKSWW-33-2-151_F4.gif

    The component planes of 26 water quality parameters.

    JKSWW-33-2-151_F5.gif

    Hotspots of (a) TOC and (b) Pb in the test-bed sites. (arrows mean the flow direction in sewers)

    Table

    Summary of water quality parameters measured at twelve monitoring points of the study site

    Results of mean quantization error (MQE) and quantitative topographic error (QTE) for each SOM map size

    References

    1. Banik, B. K. , Di Cristo, C. and Leopardi, A. (2014). SWMM5 toolkit development for pollution source identification in sewer systems, Procedia Eng., 89, 750-757.
    2. Bedoya, D. , Manolakos, E. and Novotny, V. (2011). Characterization of biological responses under different environmental conditions: A hierarchical modeling approach, Ecol. Model., 222, 532-545.
    3. Davies, D. L. and Bouldin, D. W. (1979). A cluster separation measure, IEEE Trans. Pattern Anal. Mach. Intell., 1(2), 224-227.
    4. Kohler, A. , Ohrnberger, M. and Scherbaum, F. (2009). Unsupervised feature selection and general pattern discovery using self-organizing maps for gaining insights into the nature of seismic wavefields, Comput. Geosci., 35, 1757-1767.
    5. Kohonen, T. (2001). Self-Organzing Maps, 3rd edition, Springer, Berlin Heidelberg.
    6. Mekler, A. and Schwarz, D. (2014). Quality assessment of data discrimination using self-organizing maps, J. Biomed. Inform., 51, 210-218.
    7. Paik, B. C. , Kim, C. K. and Kim, T. R. (2011). A study on the pattern analysis of correlation between the river flow and water quality using a SOM(self organizing maps) technique, J. Korean Soc. Urban Environ., 11(2), 153-160.
    8. Nam, H. K. , Choi, S. H. and Yoo, J. C. (2015). Patterning waterbird assemblages on rice fields using self-organizing map and random forest, Korean J. Environ. Agric., 34(3), 168-177.
    9. Vesanto, J. and Alhoniemi, E. (2000). Clustering of the self-organizing map, IEEE Trans. Neural Netw., 11(3), 586-600.