• Integrated PCA-cluster Framework for Classifying Groundwater Level Variation Types in Rural Area
  • Sung-Ho Song1*, Ga-Young Hwang2, and Hwan-Ho Yong2

  • 1Groundwater and Environment Engineering,
    2Rural Research Institute, Korea Rural Community Corporation

  • PCA-군집분석 통합 기법을 이용한 농촌지역 지하수위 변동 유형 분류
  • 송성호1*ㆍ황가영2ㆍ용환호2

  • 1㈜지엔이이엔지, 2한국농어촌공사 농어촌연구원

  • This article is an open access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.


Abstract

This study classified groundwater level variation types in rural areas by analyzing long-term groundwater level time series and hydrogeological variables from 157 monitoring wells. Groundwater level trends and variability were quantified using the Mann-Kendall test and Sen’s slope estimator, and a multivariate dataset including hydraulic conductivity, elevation, depth, hydrogeological unit (HGU), and pumping rates was used to perform hierarchical cluster analysis and principal component analysis (PCA). The cluster analysis identified four distinct groundwater level variation types-persistent decline, stable increase, low variability, and high variability in highly permeable aquifers-reflecting differences in groundwater response to geological, topographic, climatic, and anthropogenic factors. PCA showed that PC1 was dominated by hydraulic conductivity, while PC2 was primarily governed by groundwater level trend with secondary hydrogeologic influences. These components effectively summarized major groundwater variation patterns. Visualization of the four clusters in the PC1-PC2 space showed clear separation among groups, demonstrating that PCA provides a concise and robust framework for distinguishing groundwater level variation patterns in rural monitoring networks.


Keywords: Principal component analysis (PCA), Hierarchical cluster analysis, Groundwater level variation type, Groundwater monitoring wells, Hydrogeological unit (HGU)

1. 서 론

지하수위는 기후변화, 강수 특성, 지질 구조, 토지이용, 양수 활동 등 다양한 자연적인 요인과 인위적 요인이 동시에 영향을 미치는 복합적 수문 변수이다(Siyad and Mohamed, 2025; Davamani et al., 2024). 이러한 요인들은 시간적으로 비선형적이며 상호 연관되어 나타나기 때문에, 지하수위 시계열의 변동성을 체계적으로 해석하기 위해서는 다변량 자료를 통합적으로 분석하는 접근 방식이 요구된다. 최근에는 장기 관측자료의 축적과 함께 지하수위 변화의 구조적 패턴을 규명하고, 지역별 지하수위 변동 특성을 정량적으로 유형화하려는 연구가 활발히 이루어지고 있다(Asoka et al., 2017; Yu et al., 2024; Lin and Liang, 2024; Ebeling et al., 2025).
이러한 배경에서 주성분분석(principal component analysis, PCA)은 고차원 시계열자료의 주요 변동 요인을 추출하고, 관측공 간 공통된 변동 모드를 식별하는 데 효과적인 기법으로 널리 활용되고 있다. 특히 PCA를 지하수위 시계열 분석에 적용하여 지하수 변동의 지배 요인을 규명하거나 예측 모델의 입력 변수로 활용하는 연구들이 보고되고 있다. 예를 들어 Thakur et al.(2025)은 장기 지하수위 시계열을 LSTM (long short-term memory) 기반 모델로 예측하는 과정에서 PCA를 활용하여, 입력 변수의 차원을 축소함으로써 예측 성능을 향상시킨 바 있다. 또한 Zhang et al.(2024)은 지하수위, 강수, 수문 자료를 PCA로 축약하여 신경망 기반 예측 모델의 입력 변수로 활용함으로써 지하수위 계산 효율과 정확도를 동시에 개선하였다. 이러한 연구들은 PCA가 지하수위 시계열의 복잡성을 단순화하고, 변동 특성을 구조적으로 해석하는데 유용한 도구임을 보여준다.
국내에서도 지하수위 시계열의 장기 변화 분석, 지하수-지표수 연계 특성 해석, 강수에 의한 지하수 반응성 평가, 지하수위 예측 모델링 등 다양한 분야에서 PCA가 활용되고 있으며, 최근에는 지하수위 변화 특성과 수문지질 변수를 통합하여 지하수위 변동 특성을 분류하려는 연구와 함께 지하수 수질 및 오염부지 특성화 분야에서 적용 사례가 증가하고 있다(Kim et al., 2012; Lee et al., 2020; Yu et al., 2022; Choi et al., 2024). 그러나 기존 연구는 특정 지역 또는 제한된 변수 중심의 분석이 대부분이어서, 지하수위 시계열과 수문지질 특성을 동시에 고려한 전국 단위의 통합적 유형화 연구는 부족한 실정이다.
이 연구는 지하수위 시계열에서 추출한 변화 특성과 수문지질 변수를 통합하여 PCA를 수행하고, 이를 기반으로 관측공 간의 구조적 유사성을 군집화함으로써 지하수위 변동 유형을 분류하였다. 또한 PCA 공간에서 각 군집의 전형적 지하수 유동 특성을 제시함으로써, 향후 농촌지역 지하수 관리 및 모니터링 전략 수립에 기여할 수 있는 분석 체계를 제안하였다.

2. 연구방법

2.1.농촌지하수 관측망
이 연구에서는 전국적으로 분포하는 157개 농촌지하수 관측공을 대상으로, 지하수위 변동 특성과 수문지질 변수를 통합 분석하였다(Table 1, Fig. 1). 각 관측공에 대해 명칭, 관측 시작과 종료 연도, 해발고도, 양수량, 심도, 수리전도도, 수문지질 단위(hydrogeoloical unit, HGU) 등 지하수위 변동에 영향을 미치는 수리지질학적 요소를 수집하였다.
관측공은 다양한 지질 환경에 분포하고 있으며, 이에 따라 HGU 역시 여러 유형이 포함된다. 관측공의 심도는 약 20~300 m 범위로 나타나 천부 대수층과 심부 암반 대수층이 혼재하는 특성을 보인다. 이러한 특성은 지하수위 변동 해석 시 외부 영향 및 함양원과의 관계가 복합적으로 작용할 가능성이 있지만, 이 연구는 시계열 자료를 이용한 지하수위 변동 유형을 분류하는 목적으로 수행됨에 따라 심도에 따른 세부적 구분은 향후 보다 정교한 분석을 위한 보완 요소로 고려될 수 있을 것으로 판단된다. 수리전도도는 10-4 cm/sec 수준의 저투수성 지역부터 10-1 cm/sec 이상의 고투수성 지역까지 폭넓게 분포하며, 일부 관측공에서는 4.2 ~ 7.7 cm/sec의 높은 값이 나타나 강수 또는 하천수와의 교환이 활발할 것으로 판단된다.
양수량은 관측공 주변의 인위적 영향 정도를 나타내는 지표로 활용되었으며, 일부 지역에서는 높은 양수량이 지하수위 감소 경향에 영향을 미칠 수 있는 것으로 판단된다. 반면 해발고도가 높은 산지 지역에서는 양수량이 매우 낮아 자연적 재충전이 지하수위 변동의 주요 요인으로 작용하는 것으로 판단된다. 해발고도는 0~500 m 범위로 다양하게 분포하며, 이는 지하수위의 절대적 높이뿐만 아니라 강수의 충전량 및 지하수 유동 경사에도 영향을 미치는 것으로 판단된다.
분석에 이용된 157개 관측공은 모두 2025년을 기준으로 최소 10년 이상 연속된 지하수위 자료를 보유하고 있어, 장기 추세 분석을 통해 변화 경향을 신뢰성 있게 평가할 수 있었다. 관측공별 자료의 시작 연도는 상이하지만 모든 관측공이 장기 변동성을 안정적으로 반영할 수 있는 최소 기간(10년)을 충족하므로, 시계열 길이의 절대적 일치 여부와 관계없이 PCA 및 군집분석을 수행하는데 필요한 통계적 일관성과 비교 가능성이 확보된 것으로 판단된다.
지하수위 변동에 영향을 미치는 요인은 기후 요인, 인위적 영향, 수문지질 특성과 더불어 토지피복 변화, 하천-지하수 상호작용, 지형·토양 조건 등 다양한 인자가 복합적으로 작용하는 것으로 알려져 있다. 그러나 광역적인 규모에서 장기간의 지하수위 변동을 해석하는 기존 연구들에서는 이 중 기후 요인, 인위적 영향, 수문지질 특성의 세 범주로 구분하여 설명하는 접근법이 일반적으로 활용되었다(Alley et al., 2002; Taylor et al., 2013; Famiglietti, 2014; Scanlon et al., 2018). 따라서 이 연구에서는 선행연구의 분류 기준을 기초로, 이용 가능한 장기 시계열 자료를 통해 정량적으로 평가 가능한 요인을 중심으로 변동 특성을 해석하였다.
수집된 모든 연속형 변수는 물리적 단위가 서로 다르기 때문에, 분석에 앞서 Z-score 표준화를 수행하였다(Abdi and Williams, 2010; Jolliffe and Cadima, 2016). 이는 변수 간 스케일 차이로 인해 특정 변수가 PCA 또는 군집분석 결과에 과도하게 영향을 미치는 것을 방지하기 위함이다. 또한 결측값이 존재하는 관측공 또는 변수는 분석에서 제외하여 자료의 일관성과 신뢰성을 확보하였다.
2.2.비모수적 통계 분석
지하수위 시계열 자료는 강수, 증발산, 양수, 지질 구조 등 다양한 요인의 영향을 동시에 받으며, 비정규성(non‑normality), 계절성(seasonality), 이상치(outliers), 자기상관(autocorrelation)이 빈번하게 나타난다. 이러한 특성으로 인해 정규성 가정을 필요로 하는 모수적(parametric) 기법보다는 비모수적(non‑parametric) 기법이 더 적합하다는 점이 국내외 연구에서 제시되었다(Asoka et al., 2017; Kumar et al., 2018). 특히 Mann–Kendall 검정(MK test)과 Sen’s slope 추정법은 수문·기상 시계열 분석에서 가장 널리 사용되는 비모수적 방법으로 평가된다.
이 연구에서는 관측공별 지하수위 시계열의 장기 변화 경향을 정량화하기 위해 MK 검정을 이용하여 추세의 유의성을 평가하고, Sen’s slope estimator를 이용하여 추세의 크기(기울기)를 산정하였다.
2.2.1. MK 검정에 의한 추세 유의성 평가
MK 검정은 시계열의 단조 추세(monotonic trend)를 평가하는 대표적인 비모수적 방법으로, 관측값의 크기 대신 순위(rank)에 기반하여 통계량을 산정한다. 시계열 {xt}에 대해 MK 통계량 S는 식(1)과 같이 정의된다.



여기서, S는 MK 검정 통계량, xi, xj는 각각 시계열의 i번째와 j번째 관측값, n은 전체 관측값의 개수, sgn(·)은 부호 함수(sign function)이다. 이러한 표준화된 통계량을 이용하여 유의수준 α에서 상승, 하강, 추세없음 여부를 판정한다.
이 연구에서는 각 관측공의 일별 지하수위 시계열에 대해 전체 기간 추세와 최근 5년 추세를 각각 산정하였다.
2.2.2. Sen’s slope estimator에 의한 추세 크기 산정
추세의 방향뿐 아니라 변화 속도(기울기)를 정량화하기 위해 Sen’s slope estimator를 적용하였다. 모든 시점 쌍 (i, j)에 대해 식 (2)를 이용하여 기울기Qij를 계산하고, 그 중앙값을 Sen 기울기로 정의하였다.



여기서, Qiji 번째와 j번째 관측값 사이의 기울기, xi, xj는 각각 시계열의 i 번째와 j 번째 관측값, j-i는 두 관측값 사이의 시간 간격, j> i는 후행 시점이 선행 시점보다 뒤에 있어야 함을 의미한다.
Sen’s slope는 이상치에 민감하지 않으며, MK 검정과 함께 사용될 때 “유의한 추세 + 지하수위 변화율”을 동시에 제공하므로, MK 검정과 Sen’s slope 조합은 지하수위 저하 지역을 진단하는 데 가장 신뢰성 높은 방법으로 활용되고 있다(Sen, 1968; Yue and Wang, 2004; Asoka et al., 2017).
이 연구에서는 Sen 기울기를 PCA 및 군집분석의 입력 변수로 활용하였다.
2.3.군집분석(cluster analysis)
지하수위 변동 특성은 기후, 지질, 지형, 토지이용, 양수 활동 등 다양한 요인에 의해 영향을 받기 때문에, 공간적으로 이질적인 관측공 사이의 패턴을 체계적으로 분류하는 작업은 지하수위 변동의 구조적 특성을 이해하는 데 필수적이다. 최근에는 장기간 지하수위 시계열자료를 기반으로 통계적·수문학적 분석을 수행하고, 이를 군집분석 기법과 결합하여 지역별 지하수 반응 특성을 유형화하는 연구가 활발하게 진행되고 있다(Asoka et al., 2017).
이 연구에서는 전국 157개 농촌지하수 관측망의 시계열 기반 특성과 수문지질 변수를 통합한 다변량 자료를 이용하여, 관측공 간 지하수위 변동 유형을 군집분석으로 분류하였다. 이를 위하여 지하수위 변화율, 지하수위 변동 추세, 추세 유의성 등 지하수위 기반 특성 변수와 함께 수리전도도, 심도, 양수량, HGU 등 지하수 반응을 결정하는 수문지질 및 인위적 영향 변수를 포함하여 다변량 자료를 구축하였다.
군집분석은 계층적 군집분석(hierarchical clustering)을 적용하였으며, 덴드로그램(dendrogram)을 이용하여 관측공 간 유사성을 평가하고 대표적인 지하수위 변동 유형을 도출하였다. Ward 연결법(Ward’s linkage)을 적용하여 생성된 덴드로그램은 관측공 간의 비유사도(distance)를 수직축으로 나타내며, 결합 높이의 급격한 변화는 지하수위 변동 특성의 차이를 반영한다(Ward, 1963). 특히 비유사도의 급증 구간은 군집 수를 결정하는 기준인 “optimal cut height”로 활용된다(Murtagh and Legendre, 2014). 지하수위 기반 특성 변수는 관측공별 지하수위의 장기 변화 추세와 변동성을 정량적으로 나타내어 군집 간의 차이를 설명하는 핵심 지표로 활용되었으며, 수문지질 및 인위적 영향 변수는 지하수 반응 속도, 회복력, 인위적 영향 정도를 반영하여 군집의 해석적 의미를 강조하였다.
2.4.주성분 분석(PCA)
이 연구에서는 지하수위 시계열자료와 수문·지질 변수 간의 다변량 구조를 분석하기 위해 PCA를 적용하였다. PCA는 서로 다른 단위와 규모를 갖는 다수의 변수를 소수의 독립적인 축(PC1, PC2)으로 구분하여 데이터의 주요 변동성을 설명하는 통계 기법이다. 이를 통해 고차원 자료의 구조적 특성을 시각적으로 해석하고, 관측공 간 유사성 및 군집 구조를 파악할 수 있다.
PCA 적용에 앞서 입력 변수들의 타당성을 검증하기 위해 변수 간 상관성 분석을 수행하였다. 지하수위 시계열 특성과 수문·지질 변수 간의 피어슨 상관계수를 산정하여 다중공선성 여부를 확인하였으며, 상관성이 과도하게 높은 변수는 제거하고 대표 변수를 선택하여 입력 변수의 독립성을 확보하였다. 이러한 절차는 PCA가 변수 간 상관 구조를 기반으로 주요 변동성을 추출하는 기법이라는 점에서 필수적인 사전 단계로 제시되어 왔다(Jolliffe, 2002; Abdi and Williams, 2010).
또한 변수의 분포 특성과 단위 차이를 보정하기 위해 표준화(Z-score normalization)를 적용하여 PCA의 가정(변수 간 분산의 동등성)을 충족시켰다. 이러한 사전 검증 과정을 통해 본 연구에서 사용한 PCA 입력 변수들은 통계적으로 타당하며, 지하수위 변동성과 수문·지질 특성 간의 다변량 구조를 해석하는 데 적합함을 확인하였다.
PCA는 변수의 크기(scale)에 민감하므로, 분석에 사용된 모든 변수(지하수위 변화율, 해발고도, 수리전도도, 심도, 양수량)를 식 (3)을 이용하여 평균 0, 표준편차 1이 되도록 표준화하였다. 이때 표준화는 서로 다른 단위를 갖는 변수 간의 영향력을 동일하게 맞추기 위한 필수 과정이다.



여기서, z는 표준화된 변수값(평균 0, 표준편차 1), c는 원본 변수값, μ는 해당 변수의 평균값, μ는 해당 변수의 표준편차이다.
표준화된 자료 행렬 Z를 이용하여 변수 간 공분산 행렬(covariance matrix) C를 산정하였다(식 (4)). 이때 공분산 행렬은 각 변수 쌍이 함께 변동하는 정도를 나타내며, PCA의 기초가 된다.



여기서, C는 공분산 행렬, Z는 표준화된 데이터 행렬(관측공×변수), ZTZ의 번치행렬, n은 관측공 개수이다.
공분산 행렬 C에 대해 고유값(eigenvalue, λ)과 고유벡터(eigenvector, l)는 식 (5)를 이용하여 계산하였다.




여기서 C는 공분산 행렬, v 는 고유벡터, λ는 고유값이다.
이 연구에서는 고유값이 가장 큰 고유벡터를 PC1, 두 번째로 큰 고유벡터를 PC2로 정의하였다. 이때 PC1은 전체 변동성을 가장 많이 설명하는 축으로, 지하수위 변화 및 투수성과 관련된 변수가 해당된다. PC2는 PC1과 직교하며 두 번째로 많은 변동성을 설명하는 축으로, 인위적 영향 및 지하수 반응성과 관련된 변수가 해당된다.
이러한 과정을 거쳐 각 관측공의 PC1 및 PC2 점수는 각각 식 (6)과 식 (7)을 이용하여 계산하였다.



즉, 표준화된 데이터(Z)에 각 주성분의 고유벡터(n)를 곱하여 관측공별 주성분 점수를 산출하였다.

Fig. 1

Location of the groundwater monitoring network in rural area (n = 157).

Table 1

Specification of groundwater monitoring wells (n=157)

HGU: hydrogeological unit, II: intrusive igneous rock, M: metamorphic rock, L: limestone, CS: clastic sedimentary rock, NPV: non-porous volcanic rock, SCS: semi-consolidated clastic sedimentary rock

3. 연구결과

3.1. 비모수적 분석
157개 농촌지하수 관측공을 대상으로 MK 검정과 Sen’s slope를 적용하여 지하수위 시계열의 장기 변화 경향을 분석하였다. 전체 관측공 중 절반 이상에서 유의수준 0.05에서 통계적으로 유의한 추세가 나타났으며, 이는 전국 농촌지역 지하수위가 장기적으로 뚜렷한 변화 양상을 보이고 있음을 의미한다. MK 검정 결과는 상승(▲), 하강(▽), 추세 없음(–)으로 구분하였으며, Sen’s slope는 연간 지하수위 변화율(m/year)로 산정하였다(Table 2, Fig. 2).
MK 검정은 시계열 내 자기상관이 존재하는 경우 추세의 유의성이 과대평가될 수 있으므로(Yue et al., 2002), 이 연구에서는 1차 자기상관을 검토한 후 Trend-Free Pre-Whitening (TFPW) 절차를 적용하여 자기상관을 제거한 후 MK 검정을 수행하였다.
상승 추세를 보이는 관측공은 전국적으로 고르게 분포하였으며, GP1, GN3, JP1, SNC4, GOS3 등은 0.05~0.31 m/year 수준의 완만한 증가 경향이 나타났다. 일부 관측공(GYJ1, JJ3, POC1 등)은 0.7~1.0 m/year 이상의 큰 증가율을 보였는데, 이는 고투수성 기반의 충적층 또는 하천 인접 지역에서 강수 함양이 빠르게 반영된 결과로 해석된다. 이러한 증가형 관측공은 주로 중·고투수성 HGU (M, II, SCS 등)에 분포하는 경향을 보였다.
반면 하강 추세를 보이는 관측공도 광범위하게 나타났다. GN2, SAJ1, CN3, CS1 등은 -0.15 ~ -0.06 m/year 범위의 감소율을 보였으며, 일부 관측공(SAJ2, GS1, YCN3 등)은 -0.20 ~ -0.12 m/year 이상의 급격한 하강이 나타났다. 이러한 감소형 관측공은 상대적으로 낮은 투수성 기반암 지역 또는 양수량이 높은 지역에서 주로 나타났으며, 이는 제한된 재충전 조건 또는 인위적 영향이 장기적 지하수위 저하로 이어진 것으로 판단된다.
추세 없음(–)으로 분류된 관측공은 전체의 약 10% 내외로 나타났으며, 이들은 대부분 Sen’s slope가 -0.01 ~ 0.01 m/year 범위에 해당하는 매우 작은 변화율을 보였다. 이러한 관측공은 지질·지형적 특성이 안정적이거나 인위적 영향이 적은 지역으로, 계절적 변동 중심의 안정적 지하수 유동을 나타내는 것으로 해석된다.
전체적으로 Sen’s slope의 분포는 -0.21 ~ 1.07 m/year 범위로 분포하여 농촌지역 지하수위 변동이 지역별로 매우 상이함을 보여준다. 특히 증가형과 감소형 관측공이 혼재하는 공간적 패턴은 지하수위 변화가 단일 요인에 의해 결정되기보다는 지질·지형·기후·양수량 등 복합적 요인의 상호작용에 의해 좌우된다는 것으로 판단된다.
또한 MK 검정의 p-value는 대부분 0.05 이하로 나타나 장기 관측자료를 기반으로 지하수위 변화 경향을 신뢰성 있게 평가할 수 있음을 확인하였다.
3.2. 군집분석
군집 수 결정의 객관성을 보완하기 위해 실루엣 지수(silhouette index)와 갭 통계량(gap statistic)을 추가로 산정한 결과, 두 지표 모두 4개 군집에서 최적값을 나타내서 덴드로그램 기반 판단과 일관된 결과를 보였다. 분석 결과 비유사도 약 12~20 구간에서 군집 간 결합 높이가 급격히 증가하는 구조적 단절(structural break)이 확인되었으며, 이를 기준으로 관측공은 4가지 주요 지하수위 변동 유형으로 분류되었다(Fig. 3). 이때 가독성을 높이기 위하여 가로축 라벨 중첩을 제거하여 시각적 명확성을 확보하였다.
도출된 군집은 (1) 인위적 영향 또는 저투수층 기반의 지속적 감소형(negative trend, cluster 1), (2) 중·고 투수층 기반의 안정적 증가형(positive trend, cluster 2), (3) 안정적으로 지하수위가 유지되는 무변화형 또는 저변동형(slope≈0, cluster 3), (4) 수리전도도가 매우 높고 강수·양수의 영향에 민감한 고투수층 기반 고변동형(cluster 4)으로 구분되었다. 이들 군집은 지하수위 변동 추세뿐만 아니라 수리전도도, 심도, 양수량, HGU 등 수문지질 특성에서도 뚜렷한 차이를 보였다.
Ward 방법은 군집 내 제곱합 증가량을 최소화하는 방식으로 군집을 병합하기 때문에, 군집 간 결합 높이의 급격한 증가 지점은 서로 다른 지하수위 변동 체계가 본질적으로 구분되는 경계를 의미한다. 따라서 거리 약 12 ~ 20 구간의 급격한 상승은 이러한 이론적 특성과 일치하며, 4개 군집 분류가 통계적 및 수문학적으로 타당함을 뒷받침한다.
군집별 HGU 빈도 분석 결과, 군집 1은 II와 CS의 비중이 높아 기반암과 퇴적층 계열이 혼재된 지질 환경에서 지속적 감소형 변동이 나타나는 경향을 보였다. 군집 2는 M과 II의 빈도가 높아 중·저투수성 기반암 계열에서 안정적인 증가형 변동이 주로 나타났다(Fig. 4). 반면 군집 3과 군집 4는 특정 HGU가 지배적이지 않아 다양한 지질 환경이 혼재된 지역에 해당하며, 이는 두 군집이 지질적 요인보다는 기후·양수·수리전도도 등 다른 요인의 영향을 더 크게 받는 변동 특성을 보인다는 점을 시사한다.
결과적으로 군집 간 지질적 배경이 뚜렷하게 구분되는 군집(1과 2)과 지질학적 다양성이 큰 군집(3과 4)으로 구분되며, 이는 지하수위 변동 추세를 해석할 때 지질학적 이질성이 중요한 요인으로 작용하는 것으로 판단된다.
3.3. 주성분 분석
농촌지하수 관측망의 지하수위 변화 특성(변화 추세, 변동성), 수문지질 인자(수리전도도, 해발고도, 심도), 인위적 영향 지표(양수량) 등을 통합하여 다변량 자료 행렬을 구성한 뒤, 변수 간 상관성으로 인한 중복 정보를 제거하고 주요 변동 요인을 추출하기 위해 PCA를 수행하였다(Table 2). 분석에 사용된 연속형 변수들은 서로 다른 물리적 단위를 가지므로 Z-score 표준화를 적용하였으며, 이후 공분산 행렬의 고유값 분해를 통해 주성분을 도출하였다.
분석 결과 전체 자료의 변동성 중 상당 부분이 PC1과 PC2에 의해 설명되는 것으로 나타났다. 이는 농촌지역 지하수위 변동의 복잡한 다차원적 특성이 소수의 직교 축에 의해 효과적으로 구분될 수 있음을 의미하며, 전국 단위 지하수위 변동의 주요 패턴이 비교적 단순한 구조를 가진다는 점을 시사한다.
PC1은 가장 큰 설명력을 가지는 축으로, 수리전도도(0.668)가 가장 높은 적재값(loading)을 보이는 것으로 나타났다(Table 3). 또한 양수량 (0.062)이 보조적으로 기여하였다. 따라서 PC1값이 큰 관측공은 투수성이 높아 지하수위 변동이 상대적으로 크게 나타나는 경향이 있으며, PC1 값이 낮은 관측공은 저투수성 기반의 완만한 변동 또는 외부 영향에 둔감한 특성을 나타낸다.
반면 PC2는 지하수위 변화율(0.696)이 가장 높은 적재값을 보였으며, 해발고도(0.195), 수리전도도(0.181), 양수량(0.143)이 상대적으로 낮은 수준에서 기여하는 것으로 나타났다. 이에 따라 PC2는 지하수위 변화 경향을 중심으로 일부 지질학적 배경(geological setting)과 인위적 요인이 결합된 변동성을 설명하는 축으로 해석된다. 즉 장기적으로 지속적인 상승 또는 하강하는 경향을 보이는 관측공들이 PC2의 양(+)과 음(-)의 방향으로 구분되는 경향이 나타났다.
공분산 행렬의 고유값 분해 결과 PC1과 PC2는 각각 전체 변동성의 27.0%와 21.3%를 설명하는 것으로 나타났으며, 두 주성분의 누적 설명력은 48.3%로 확인되었다. PC1–PC2 공간에서 관측공들을 시각화한 결과, 네 개의 군집은 전반적으로 서로 다른 영역에 분포하였으나 일부 군집 간에는 중첩되는 부분도 나타났다(Fig. 5). 군집 1과 군집 2는 PC1과 PC2 전반에 걸쳐 비교적 넓게 분포하여 두 군집 간의 경계가 명확하게 분리되지는 않았으며, 이는 두 군집이 일부 수리지질 및 수문학적 특성을 공유하면서도 지하수위 변동 양상에서 차이를 보인다는 점을 반영한다.
군집 3은 PC1과 PC2의 중심부에 밀집되어 나타났으며, 이는 지하수위 변화가 크지 않고 계절적 변동 중심의 안정적 패턴을 보이는 관측공들이 포함되어 있음을 의미한다. 군집 4는 PC1 축에서 다른 군집과 거리를 두고 분리되는데, 이는 해당 군집이 높은 투수성, 큰 변동폭, 강수 및 양수 영향에 대한 민감도 등 독립적인 지하수 거동 특성을 가지는 것으로 판단된다.
이러한 PCA 기반 분포는 덴드로그램에서 확인된 4가지 군집 구조와 일관되며, 농촌지역 지하수위 변동이 단일 요인에 의해 결정되는 것이 아니라, 대수층의 투수성(PC1)과 지하수위 변화 경향 및 지질학적 배경 특성(PC2)의 조합에 의해 결정된다는 점을 보여준다. 또한 PCA가 군집 간 구조적 차이를 효과적으로 요약하고 시가화함으로써, 지하수위 변동 유형을 분류하는데 유용한 도구임을 확인하였다. 이는 전국 단위 지하수 관리 전략 수립, 지역별 지하수 취약성 평가, 기후 변화 대응 정책 마련 등에 활용될 수 있는 중요한 기초자료로 활용될 수 있다(Murtagh and Legendre, 2014; Ward, 1963).

Fig. 2

Spatial distribution of long-term groundwater level trends in rural area.

Fig. 3

Dendrogram of groundwater monitoring wells (n = 157).

Fig. 4

Distribution of hydrogeologic units (HGU) across the four groundwater clusters. The bar chart illustrates the frequency of major hydrogeologic units (CS, II, L, M, NPV, and SCS) within each cluster.

Fig. 5

PCA scatter plot showing representative wells for each cluster.

Table 2

Results of non-parametric trend analysis and principal component analysis (PCA)

▲: increasing, ▽: decreasing, -: no trend

Table 3

PCA loading matrix for groundwater level indicators, hydrogeologic parameters, and anthropogenic factors

4. 토의 및 결론

이 연구에서는 지하수 관측망을 대상으로 지하수위 시계열 특성, 수문지질 인자, 인위적 영향 지표를 통합한 다변량 분석을 수행하여, 농촌지역 지하수위 변동 유형을 정량적으로 분류하였다. 특히 계층적 군집분석과 PCA를 결합함으로써, 전국 단위 지하수위 변동의 공간적 이질성과 변동성의 주요 영향 요인을 동시에 해석할 수 있는 분석 체계를 제시하였다. 이러한 접근법은 기존의 단일 변수 기반 분석이 갖는 한계를 보완하며, 복잡한 지하수 유동을 구조적으로 이해하는 데 중요한 것으로 판단된다.
계층적 군집분석 결과 전국 157개 관측공은 네 가지 대표적 지하수위 변동 유형으로 구분되었다. Ward 연결법을 적용한 덴드로그램에서 비유사도 12~20 구간에서 급격한 결합 높이 증가가 나타났으며, 이는 서로 다른 변동 특성을 가진 관측공들이 명확히 분리되는 구조적 단절을 의미한다. 이러한 급격한 상승 구간은 군집 수 결정의 핵심 기준으로 활용되며, 도출된 4개 군집 구조는 통계적·수문학적으로 모두 타당한 것으로 판단된다.
군집별 특성으로 군집 1(지속적 감소형)은 낮은 투수성 또는 높은 양수량의 영향을 받아 지하수위가 장기적으로 하강하는 지역이 포함된다. 일반적으로 농업지대 또는 도시 주변과 같이 인위적 영향이 큰 지역에서 흔히 나타나는 유형이다. 군집 2(안정적 증가형)은 중·고투수층 기반의 지질 환경에서 강수 함양이 원활하게 이루어지는 지역이 해당된다. 군집 3(무변화형 또는 저변동형)은 계절적 변동 중심의 안정적 거동을 보이며, 군집 4(고변동형)는 고투수성 기반의 빠른 지하수 반응성과 큰 변동폭을 보이는 것으로 나타났다. 이러한 군집별 차이는 지하수위 변화 패턴뿐 아니라 수리전도도, 심도, 양수량, HGU 등 수문 및 수리지질적 변수에서도 일관되게 나타났다.
PCA 결과는 지하수위 변동을 설명하는 두 가지 주요 축이 존재함을 보여주었다. PC1은 수리전도도가 가장 높은 적재값을 보였으며, 양수량이 보조적으로 기여하였다. 이는 PC1이 대수층의 투수성 차이를 반영하는 축으로 해석된다. 따라서 PC1 값이 큰 관측공은 투수성이 높은 반면, PC1 값이 낮은 관측공은 저투수층 기반의 완만한 변동 또는 지속적 감소 경향을 보였다. 반면 PC2는 지하수위 변화율이 가장 높은 적재값을 보였고, 해발고도, 수리전도도, 양수량이 상대적으로 낮은 수준에서 기여하였다. 이에 따라 PC2는 지하수위 변화 경향을 중심으로 지형·수리지질 및 인위적 요인이 결합된 변동성을 설명하는 축으로 해석된다. 결과적으로 PCA 구조는 지하수위 변동이 단일 요인에 의해 결정되는 것이 아니라, 대수층의 투수성(PC1)과 지하수위 변화 경향(PC2)이라는 두 가지 독립적 축의 조합으로 결정되는 것으로 판단된다.
PC1–PC2 공간에서 군집별 분포를 시각화한 결과, 네 개의 군집은 서로 다른 영역에 분포하였다. 특히 군집 4는 PC1 축에서 뚜렷하게 분리되어 투수성이 높은 대수층에서 나타나는 빠른 지하수위 반응성과 높은 변동성을 반영하였다. 군집 1과 군집 2는 PC2 축에서 장기적인 지하수위 변화 경향의 차이에 따라 구분되는 경향을 보였으며, 군집 3은 두 축 모두에서 중간 영역에 위치하여 안정적 변동 특성을 나타냈다. 이러한 결과는 PCA가 지하수위 변동의 구조적 차이를 효과적으로 요약하고 유형화하는 데 매우 유용함을 보여준다.
결론적으로 이 연구는 전국 단위 지하수 관측망 자료를 활용하여 지하수위 변동 유형을 정량적으로 분류하고, 변동의 주요 요인을 통합적으로 해석할 수 있는 분석 체계를 제시하였다. 특히 군집분석과 PCA를 결합한 접근은 지하수위 변동 특성의 공간적 이질성을 정량적으로 평가하고, 지역별 지하수 취약성 진단 및 관리 전략 수립에 활용될 수 있는 중요한 기초자료를 제공한다. 향후 연구에서는 기후변화 시나리오, 토지이용 변화, 장기 양수량 변동 등을 추가적으로 고려하여 지하수위 변동 특성의 미래 변동성을 예측하는 연구가 필요하며, 이 연구에서 제시한 분석 체계는 이러한 확장 연구의 기반으로 활용될 수 있을 것으로 판단된다.

사사

이 연구는 환경부의 재원으로 한국환경산업기술원의 물공급 취약지역 지하수저류댐관리 기술개발사업(RS-2025-01842972)의 지원을 받아 수행되었습니다.

References
  • 1. Abdi, H. and Williams, L.J., 2010, Principal component analysis, Wiley Interdiscip. Rev. Comput. Stat., 2(4), 433-459.
  •  
  • 2. Alley, W.M., Healy, R.W., LaBaugh, J.W., and Relly, T.E., 2002, Flow and storage in groundwater systems, Science, 296(5575), 1985-1990.
  •  
  • 3. Asoka, A., Gleeson, T., Wada, Y., and Mishra, V., 2017, Relative contribution of monsoon precipitation and pumping to changes in groundwater storage in India, Nat. Geosci., 10(2), 109-117.
  •  
  • 4. Choi, Y., Ko, K.-S., An, H., Shin, H., Jeong, S., and Lee, J., 2024, Evaluation of Pollution Characteristics using Nitrate Background Levels, Nitrate Pollution Index, and Principal Component Analysis of Groundwater in Rural Areas, Hongsung-gun, J. Soil Groundw. Environ., 29(6), 116-130.
  •  
  • 5. Davamani, V., John, J.E., Poornachandhra, C,, Gopalakrishnan, B., Arulmani, S., Parameswari, E., Santhosh, A., Srinivasulu, A., Lal, A., and Naidu, R., 2024, A Critical Review of Climate Change Impacts on Groundwater Resources, Atmos., 15(1), 122.
  •  
  • 6. Ebeling, P., Musolff, A., Kumar, R., and Hartmann, 2025, Groundwater head responses to droughts across Germany, Hydrol. Earth Syst. Sci., 29(13), 2925-2950.
  •  
  • 7. Famiglietti, J.S., 2014, The global groundwater crisis, Nat. Clim. Chang., 4, 945-948.
  •  
  • 8. Jolliffe, I.T., 2002, Principal component analysis 2nd Edition, Springer, New York.
  •  
  • 9. Jolliffe, I.T. and Cadima, J., 2016, Principal component analysis: A review and recent developments, Philos. Trans. R. Soc. A, 374, Article ID: 20150202.
  •  
  • 10. Kim, G.B., Son, Y.C., Lee, S.H., Jeong, A.C., Cha, E.J., and Ko, M.J., 2012, Understanding of surface water-groundwater connectivity in an alluvial plain using statistical methods, J. Eng. Geol., 22(2), 207-221.
  •  
  • 11. Kumar, P., Chandniha, D.K., Lohani, A.K., and Nema, A.K., 2018, Trend analysis of groundwater level using non-parametric tests in alluvial aquifers of Uttar Pradesh, India, Curr. World Environ., 13(1), 44-54.
  •  
  • 12. Lee, J.M., Ko, K.S., and Woo, N.C., 2020, Characterization of groundwater level ans water quality by classification of aquifer types in South Korea, Econ. Environ. Geol., 53(5), 619-629.
  •  
  • 13. Lin, J.-J. and Liang, C.-H., 2024, Terrain-based evaluation of groundwater potential and long-term monitoring at the catchment scale in Taiwan, Adv. Geosci., 64, 13-17.
  •  
  • 14. Murtagh, F. and Legendre, P., 2014, Ward¡¯s hierarchical agglomerative clustering method: which algorithms implement Ward¡¯s criterion?, J. Classif., 31, 274-295.
  •  
  • 15. Scanlona, B.R., Zhang, Z.,Save, H., Sun, A.Y., Schmied, H.M., van Beek, L.P.H., Wiese, D.N., Wada, Y., Long, D., Reedy, R.C., Longuevergne, L., Döll, P., and Bierkens, M.F.P., 2017, Global models underestimate large decadal declining and rising water storage trends relative to GRACE satellite data, Proc. Natl. Acad. Sci.,115(6), 1-10.
  •  
  • 16. Sen, P.K., 1968, Estimates of the regression coefficient based on Kendall¡¯s tau, J. Am. Stat. Assoc., 63, 1379-1389.
  •  
  • 17. Siyad, S.A. and Mohamed, Z.H., 2025, A systematic literature review on groundwater recharge dynamics under climate variability, land use change and sea level rise, Discov. Sustain., 6, 1331.
  •  
  • 18. Taylor, R.G., Scanlon, B., Döll, P., Rodell, M., van Beek, R., Wada, Y., Longuevergne, L., Leblanc, M., Famiglietti, J.S., Edmunds, M., Konikow, L., Green, T.R., Chen, J., Taniguchi, M., Bierkens, M.F.P., MacDonald, A., Fan, Y., Maxwell, R.M., Yechieli, Y., Gurdak, J.J., Allen, D.M., Shamsudduha, M., Hiscock, K., Yeh, P.J., Holman, I., and Treidel, H., 2013, Ground water and climate change, Nat. Clim. Chang., 3, 322-329.
  •  
  • 19. Thakur, A., Chandel, A., and Shankar, V., 2025, Prediction of groundwater levels using a long short‑term memory (LSTM) technique, J. Hydroinform., 27(1), 51-68.
  •  
  • 20. Ward, J.H., 1963, Hierarchical grouping to optimize an objective function, J. Am. Stat. Assoc., 58, 236-244.
  •  
  • 21. Yu, S., Kim, H.-S., Jun, S.-C., Yi, J.H., Yun, S.-T., Kwon, M.J., and Jo, H.Y., 2022, .Hydrochemical investigation for site characterization: focusing on the application of principal component analysis, J. Soil Groundw. Environ., 27(S), 34-50.
  •  
  • 22. Yu, Z.-Q., Hosono, T., Amano, H., Berndtsson, R., and Nakagawa, K., 2024, Groundwater resource assessment by applying long-term trend analysis of spring discharge, water level, and hydroclimatic parameters, Water Resour. Manag., 38, 4161-4177.
  •  
  • 23. Yue, S., Pilon, P., and Cavadias, 2002, Power of the Mann-Kendall and Spearman¡¯s rho tests for detecting monotonic trends in hydrologicalk series, J. Hydrol., 259(1-4), 254-271.
  •  
  • 24. Yue, S. and Wang, C.Y., 2004, The Mann–Kendall test modified by effective sample size to detect trend in serially correlated hydrological series, Water Resour. Manag., 18, 201-218.
  •  
  • 25. Zhang, X., Guo, X., Liu, S., Shang, X., Xu, Z., and Zhao, J., 2024, A study on groundwater level calculation based on PCA-CIWOABP, Front. Earth Sci., 12, 1445241.
  •  

This Article

  • 2026; 31(2): 16-26

    Published on Apr 30, 2026

  • 10.7857/JSGE.2026.31.2.016
  • Received on Mar 26, 2026
  • Revised on Apr 6, 2026
  • Accepted on Apr 21, 2026

Correspondence to

  • Sung-Ho Song
  • 1Groundwater and Environment Engineering

  • E-mail: shsong84@hanmail.net