Journal Archive

Journal of Korean Society for Atmospheric Environment - Vol. 32 , No. 5

[ Original Paper ]
Journal of Korean Society for Atmospheric Environment - Vol. 32, No. 5, pp. 513-525
Abbreviation: J. Korean Soc. Atmos. Environ
ISSN: 1598-7132 (Print) 2383-5346 (Online)
Print publication date Oct 2016
Received 20 Jul 2016 Revised 17 Aug 2016 Accepted 05 Oct 2016
DOI: https://doi.org/10.5572/KOSAE.2016.32.5.513

앙상블 방법에 따른 WRF/CMAQ 수치 모의 결과 비교 연구 : 2013년 부산지역 고농도 PM10 사례
김태희 ; 김유근1) ; 손장호2) ; 정주희1), *
부산대학교 지구환경시스템학부
1)부산대학교 대기환경과학과
2)동의대학교 환경공학과

A Comparison Study of Ensemble Approach Using WRF/CMAQ Model : The High PM10 Episode in Busan
Taehee Kim ; Yoo-Keun Kim1) ; Zang-Ho Shon2) ; Ju-Hee Jeong1), *
Division of Earth Environmental System, Pusan National University
1)Department of Atmospheric Sciences, Pusan National University
2)Department of Environmental Engineering, Dong-Eui University
Correspondence to : *Tel : +82-(0)51-583-2652, E-mail : jeongjuhee@pusan.ac.kr


Copyright © 2016 Korean Society for Atmospheric Environment
Funding Information ▼

Abstract

To propose an effective ensemble methods in predicting PM10 concentration, six experiments were designed by different ensemble average methods (e.g., non-weighted, single weighted, and cluster weighted methods). The single weighted method was calculated the weighted value using both multiple regression analysis and singular value decomposition and the cluster weighted method was estimated the weighted value based on temperature, relative humidity, and wind component using multiple regression analysis. The effects of ensemble average methods were significantly better in weighted average than non-weight. The results of ensemble experiments using weighted average methods were distinguished according to methods calculating the weighted value. The single weighted average method using multiple regression analysis showed the highest accuracy for hourly PM10 concentration, and the cluster weighted average method based on relative humidity showed the highest accuracy for daily mean PM10 concentration. However, the result of ensemble spread analysis showed better reliability in the single weighted average method than the cluster weighted average method based on relative humidity. Thus, the single weighted average method was the most effective method in this study case.


Keywords: Ensemble approach, Ensemble average methods, PM10, Multiple regression analysis, Singular value decomposition

1. 서 론

최근 중국 북부 공업지역에서 다량의 PM10이 유입됨에 따라 국내 고농도 PM10 발생일의 빈도는 2010년 29회, 2013년 42회로 3년 동안 약 1.45배 증가하였다(Shin et al., 2014). 이와 더불어 PM10으로 인한 경제적 손실과 인체에 미치는 영향에 대한 관심이 증가함에 따라 국내에서는 예보의 정확도 향상을 위한 예측연구가 다수 수행되었다. 하지만 국내에서 선행된 예측연구들의 대부분은 관측과 비교하여 낮은 정확도를 보였고, 하나의 모델 결과를 이용하여 예측 결과를 결정하는 결정론적 방법을 사용하여 주로 수도권 지역을 대상으로 수행되었다 (Moon et al., 2011; Yoo et al., 2011; Kim, 2009). Jang et al. (2014)에서는 기상 자료의 불확실성 (22.9%), 배출량 자료의 불확실성 (24.6%), 예보관의 경험 부족 (24.6%), 수치모델의 예측한계 (27.9%)를 낮은 모의 정확도의 원인으로 제시하였다. 선행연구에서 주로 사용된 결정론적 방법은 수치모델의 예측한계가 드러나는 방법으로, 모델은 계산과정에서 일정 수준의 오차를 포함하고 있기 때문에 초기에 같은 값을 가지고 시작하더라도 결과에서는 큰 오차가 발생할 수 있다. Leith (1974)Epstein (1969)은 이러한 초기조건과 계산과정에서의 불확실성을 최소화하기 위한 방법으로 통계적 처리를 통해 여러 개의 계산결과에서 하나의 최종 결과를 도출해 내는 추계론적 방법을 제안하였고, 이에 따라 추계론적 방법의 일환인 앙상블 (ensemble)연구의 필요성이 대두되었다.

앙상블은 서로 다른 초기조건들을 이용하여 수치모델 적분을 수행하는 방법으로 단일 예보를 수행할 때보다 예측성을 향상시킬 수 있는 통계적 예보 방법으로 알려져 있다 (Kim et al., 2015). 앙상블은 앙상블 멤버 구성에 사용되는 모델의 개수에 따라 크게 다중 모델 앙상블 (multi-model ensemble)과 단일 모델 앙상블(single-model ensemble)로 나눠진다. 이때 앙상블 결과산출을 위한 앙상블 평균 방법은 크게 비가중치 평균과 가중치 평균이 있으며, 가중치 평균은 가중치를 산정하는 방법에 따라 단일 가중치 평균, 군집별 가중치 평균 등 다양한 방법이 존재한다. Vautard et al. (2009)은 7개의 서로 다른 대기질 모델에서 예측한 PM10 농도 결과와 비가중치 평균 방법을 이용해 앙상블 결과를 산출하였고, 분석 결과 앙상블 결과가 단일 모델보다 높은 정확도를 보이며 2차 무기 에어로졸 생성의 경우 기상상태에 민감하게 반응함을 밝혀냈다. Monteiro et al. (2013)은 기상 입력 자료, 경계 자료, 화학적 메커니즘을 서로 다르게 적용하여 수행한 5개의 대기질 모델의 PM10 농도 예측 결과와 비가중치 평균 방법을 이용하여 앙상블 결과를 산출하여, 앙상블 결과는 단일모델 결과보다 92%의 바이어스 감소와 43%의 평균제곱근 편차의 감소를 보이며 공간적인 바이어스 보정에 있어 향상된 결과를 보임을 분석하였다. Žabkar et al. (2013)은 WRF-Chem 모델을 이용하여 총 51개의 앙상블 멤버를 구축하였고 비가중치 평균 방법을 이용하여 앙상블 결과를 산정하였다. 이때 앙상블 멤버는 물리적 모수화 옵션, 화학적 초기 및 경계조건, 인위적 배출량, 자연 배출량 그리고 도메인을 다르게 적용하여 구성하였고, 분석 결과 극한 값에 대해서는 차이가 없지만 확률적인 예측에서는 앙상블 결과가 단일 모델 결과보다 향상됨을 밝혀냈다.

이처럼 앙상블 연구의 필요성이 대두됨에 따라 다양한 모델 종류와 물리적, 화학적 옵션 및 경계조건 등을 이용한 앙상블 연구들이 국외에서 선행되었다. 하지만 국내의 경우 기상청 현업을 위한 고해상도 국지 앙상플 예측 시스템 구축 (Kim et al., 2015)과 같은 기상앙상블 연구는 다소 진행이 되었으나 대기질 앙상블 연구는 미흡한 실정이다. 또한 대다수의 선행연구들은 통계분석을 통한 앙상블 결과와 단일 결과의 정확도 비교 분석만 수행하였으며, 앙상블 결과 산출 시 비가중치 평균방법만을 이용하여 도출하였다 (Solazzo et al., 2012; Huijnen et al., 2010; Monache et al., 2006; Pagowski et al., 2006; McKeen et al., 2005; Monache and Stull, 2003). 하지만 비가중치 평균 방법은 특이치 (peak value)를 가지는 특정 모델 결과에 의해 앙상블 결과가 좌우될 수 있다는 한계점을 가진다. 따라서 다양한 앙상블 방법 (앙상블 평균 방법, 가중치 산정 방법)이 앙상블 결과 산출에 미치는 영향에 대한 연구의 필요성이 제시되었다. 이에 본 연구에서는 PM10 농도 예측에 있어 효과적인 앙상블 방법을 제시하고자, 최근 고농도 PM10 발생일의 증가 추세를 보인 부산지역을 대상으로 다양한 앙상블 평균 방법과 가중치 산정 방법에 따라 산정된 앙상블 결과의 통계적, 공간적 비교 분석을 실시하였다.


2. 모델 및 연구 방법
2. 1 기상/대기질 모델

PM10 모의를 위해 대기질 모델로 U.S. EPA (Environmental Protection Agency)에서 개발한 3차원 광화학 수송 모델인 CMAQ (Community Multi-scale Air Qualit Model) ver5.0.2를 사용하였고, 기상 입력 자료 생성을 위해 3차원 중규모 기상모델인 WRF (Weather Research and Forecasting Model) ver3.6을 사용하였다. 도메인은 총 4개로 동아시아 영역 (D1, 수평해상도 27 km), 한반도 영역 (D2, 9 km), 영남권 영역 (D3, 3 km), 부산 영역(D4, 1 km)으로 설정하였다 (그림 1). WRF/CMAQ 모델링에 사용된 도메인의 상세정보와 물리과정은 National Institute of Environmental Research (2014)를 참고하여 구성하였다 (표 1). CMAQ 모델링에 사용된 기상 입력 자료는 MCIP을 통해 WRF 모델링 결과를 재구성하여 사용하였고, 초기 및 경계 농도 자료는 기본 프로파일 자료를 사용하였다. 이때 WRF 모델의 초기/경계 입력 자료 생성에는 FNL (Final) 전구 재분석 자료와 SST(Sea Surface Temperature) 자료를 이용하였으며, 대상지역의 현실적인 지형과 지표면 상태를 반영하기 위해 SRTM (Shuttle Radar Topography Mission) 3 sec 자료와 EGIS (Environmental Geographic Information System) 중분류 자료를 사용하였다. 또한 초기/경계 입력 자료의 오차를 줄이기 위해 NCEP에서 제공하는 지상과 고층 관측 자료를 사용하여 자료동화를 수행하였다. 배출량 입력 자료는 인위적 배출량과 자연 배출량으로 나누어 산정하였고, 자연 배출량은 BEIS ver3.14를 이용하여 D3과 D4에 대해 산출하였다. 인위적 배출량은 남한을 제외한 동아시아 영역에는 INTEX-B (Intercontinental Chemical Transport Experiment-B) 자료 (2006), 남한에는 CAPSS (Clean Air Policy Support System) 자료 (2012)를 이용하여 공간 할당과 종 할당 과정을 거쳐 전 도메인에 대해 산정하였다.


Fig. 1. 
The nested model domains for Domain1 (D1), Domain2 (D2), Domain3 (D3) and Domain4 (D4). The right figure is enlarged details of the target areas of D4 and the yellow circles indicate the air pollution measurement networks and red circles indicate automated surface observing system. Black and red lines mean the WRF and CMAQ model domains, respectively.

Table 1. 
Details of the grids and physical options used in the WRF/CMAQ model.
D1 D2 D3 D4
WRF Horizontal grid 124×131 73×85 85×79 85×79
Horizontal resolution 27 km 9 km 3 km 1 km
Vertical layers 44 layers
Microphysics WSM5 WSM 6/Lin et al.
Radiation (long/short wave) RRTMG/RRTMG
Planetary Boundary layer YSU/MYJ
Surface layer option Revised MM5/Eta
Land surface option Noah/RUC/Pleim-Xiu land surface model
Cumulus option KF
CMAQ Horizontal grid 118×125 67×79 79×73 75×69
Horizontal resolution 27 km 9 km 3 km 1 km
Vertical layers 27 layers
Chemistry mechanism SAPRC99
Aerosol module Aero5
Other options - Horizontal advection: hyamo
- Vertical advection: vwrf
- Horizontal diffusion: multiscale
- Gas-phase chemistry solver:
EBI (Euler Backward Iterative)

사례 기간은 부산지역에서 평균 124 μg/m3의 고농도 PM10이 발생하고 사례일 전 7일을 포함하여 일평균 10 mm 이상의 강수가 발생하지 않은 2013년 3월 7일부터 3월 10일로 선정하였다. 모델링은 사례 기간과 spin-up 기간 그리고 가중치 산정 기간을 고려하여 WRF 모델링은 2013년 2월 24일부터 3월 12일까지 수행하였으며 CMAQ 모델링은 2013년 2월 26일부터 3월 11일까지 수행하였다. 일반적으로 장기간에 대해 가중치 평균을 산정할수록 적절한 통계 값을 산출할 수 있으나, 장기간의 경우 시간별 변화를 반영하지 못하는 단점이 존재한다. 이에 선행연구 (Djalalova et al., 2010)에서는 적절한 통계를 수집하기 위해 충분한 기간을 7일로 제시하였고, 본 연구에서는 사례일 전후의 강수 기간과 spinup 기간을 고려하여 가중치 산정 기간을 7일로 설정하였다.

2. 2 앙상블 실험 설계

앙상블 실험은 크게 규준 실험 단계, 앙상블 실험 단계, 앙상블 평균 단계, 총 3가지의 단계로 수행되며 산출된 결과를 앙상블 결과라 일컫는다. 먼저 규준 실험 단계에서는 앙상블 멤버 선정을 위한 기준 (규준 실험 값)을 정립하며, 일반적으로 규준 실험 값으로는 내정 값과 기본옵션을 적용한 모델링 결과나 특정 기간에서 제시하는 평가지표를 사용한다. 앙상블 실험 단계에서는 앙상블 멤버 구성을 위한 단일 결과를 도출하는 모델링을 수행한다. 마지막으로 앙상블 평균 단계에서는 규준 실험 값과 단일 결과를 이용하여 앙상블 결과를 도출해낸다. 이때 앙상블 평균 단계는 규준 실험 값을 이용한 선정과정과 선정된 단일 모델 결과를 이용한 앙상블 사이즈 산출과정, 다양한 평균 방법을 이용하여 앙상블 결과를 계산하는 앙상블 결과 계산과정으로 이루어져 있다.

본 연구에서는 동일한 버전의 모델에 대해 입력 자료, 물리옵션, 자료동화 적용 유무를 서로 다르게 적용하여 앙상블 멤버를 구성하는 단일 모델 앙상블을 사용하였고, 앙상블 평균 방법과 가중치 산정 방법에 따른 앙상블 결과의 차이를 분석하기 위하여 표 2와 같이 6개의 앙상블 실험을 구성하였다. 앙상블 평균 방법으로는 비가중치 평균, 단일 가중치 평균, 군집별 가중치 평균 방법을 이용하였고, 가중치 산정 방법으로는 최소자승법을 이용한 다중 회귀 분석과 특이값분해를 이용하였다. 이때 군집은 PM10 농도 모의에 영향을 주는 대표기상인자인 기온, 습도, 바람을 대상으로 분류하였다. 앙상블 멤버 선정을 위해 서로 다른 기상 입력 자료를 사용한 총 12개의 CMAQ 모델링으로 단일 멤버를 구성하였다. 이때 기상 입력 자료는 대기질 모델링에 있어 중요한 역할을 하는 행성경계층옵션과 미세구름물리옵션, 지표층물리옵션, 지면물리옵션을 각기 다르게 적용하였으며 상세정보는 표 3에 제시하였다.

Table 2. 
Details of the ensemble experimental designs.
Averaging methods Weighting methods
EXP1 Arithmetic -
EXP2 Single weighted Multiple regression analysis
EXP3 Single weighted SVD
EXP4 Cluster weighted (Temperature) Multiple regression analysis
EXP5 Cluster weighted (Relative humidity) Multiple regression analysis
EXP6 Cluster weighted (Wind component) Multiple regression analysis

Table 3. 
Details of the single member designs.
PBL/Surface layer Micro-physics Land surface
D1 D2~D4
Member01 (M01) YSU/MM5 WSM5 WDM6 Noah
Member02 (M02) Lin et al. Noah
Member03 (M03) WDM6 RUC
Member04 (M04) Lin et al. RUC
Member05 (M05) WDM6 Pleim-Xiu
Member06 (M06) Lin et al. Pleim-Xiu
Member07 (M07) MYJ/Eta WDM6 Noah
Member08 (M08) Lin et al. Noah
Member09 (M09) WDM6 RUC
Member10 (M10) Lin et al. RUC
Member11 (M11) WDM6 Pleim-Xiu
Member12 (M12) Lin et al. Pleim-Xiu

2. 3 연구 방법

군집분석과 가중치산정에는 SAS (Statistical Analysis System) ver9.3을 사용하였고, D4에 위치한 5개의 종관기상관측장비와 36개의 대기오염 측정망에서 측정된 2013년 2월 28일부터 3월 6일까지 자료를 이용하였다. 군집분석은 평균연결법 (Average linkage method)을 사용하여 최적의 군집 수 (K)를 결정하였으며, K-평균법 (K-mean method)을 사용하여 K개의 군집으로 최종 분류하였다. 분석은 각 앙상블 실험별 모의된 PM10 농도, 기온, 상대습도, 풍향, 풍속에 대해 실시하였다. 먼저 단일 모델의 모사능력을 평가하기 위해 통계지표를 이용한 평균적/정량적 통계분석을 실시하였고, 정량적 평가지표로는 오차를 나타내는 MBE (Mean Bias Error), RMSE (Root Mean Square Error)와 일치도를 나타내는 IOA (Index Of Agreement)를 이용하였다.

앙상블 실험별 비교 분석을 위해 단일 모델과 마찬가지로 통계분석을 실시하였고, 앙상블 실험의 검증에 있어 가장 기본적인 요소인 앙상블 스프레드 (ensemble spread)를 이용한 분석을 추가적으로 실시하였다 (Barker, 1991). 앙상블 스프레드는 앙상블 멤버들의 평균에 대한 편차로서 식 (1)과 같이 표현되며, 이때 N은 앙상블 멤버의 개수, f는 멤버별 평균 값, f(i)는 i번째 앙상블 멤버의 결과를 나타낸다.

Ensemble spread=1Ni=1Nf¯-fi2(1) 

일반적으로 앙상블 스프레드는 작아질수록 앙상블 평균이 실제 관측과 유사하고 앙상블 평균의 오차가 감소함을 의미한다. 하지만 때로는 앙상블 평균의 오차를 의미하는 RMSE와 앙상블 스프레드가 완벽한 상관성을 갖는 것이 불가능하기도 한다 (Barker, 2014). 따라서 앙상블 스프레드와 RMSE 크기가 서로 비슷하여 앙상블 스프레드가 앙상블 평균의 오차를 적절히 표현하고 앙상블 스프레드보다 RMSE가 작을 때, 해당 앙상블 실험의 신뢰성이 좋다고 평가한다 (Kim et al., 2015). 이뿐만 아니라 수평분포 분석을 통하여 앙상블 실험별 공간적 차이를 비교하였다. EXP-CT, EXP-CR, EXP-CW의 비교 분석을 통해 군집별 가중치산정 시 효율적인 대상인자를 선정하였고, 선정된 실험과 EXP-SL, EXP-SS의 비교 분석을 통해 가장 효과적인 가중치 산정 방법을 살펴보았다. 마지막으로 EXP-A과의 비교를 통해 앙상블 평균 방법에 따른 차이를 분석하였다.


3. 결 과
3. 1 단일 모델 결과 분석

그림 2는 앙상블 멤버 구성을 위해 수행된 단일 모델의 통계분석 결과이다. 분석은 시간별 농도와 일평균 농도에 대해 실시하였고, 관측 값은 D4에 위치한 대기오염 측정망 값을, 모델 결과는 대기오염 측정망 인근 격자 값을 이용하였다. 기상 입력 자료 생성 시 적용한 물리옵션에 따른 차이는 미미하게 나타났으며 평균 μg/m3의 PM10 농도를 모의하며 작은 편차를 보였다. 단일 모델들은 시간별 농도에 대해 MBE, RMSE, IOA가 평균 - 88.72 μg/m3, 88.94 μg/m3, 0.38로 계산되어 다소 큰 오차를 내포한 과소모의 경향과 낮은 일치도를 보였다. 마찬가지로 일평균 농도에 대해 MBE, RMSE가 평균 - 46.25 μg/m3, 46.25 μg/m3, IOA가 평균 0.53으로 계산되어 낮은 정확도를 보였으나, 시간별 농도와 비교하여 상대적으로 작은 오차와 높은 일치도를 보였다. 이때 기상 입력 자료 생성 시 적용한 물리옵션에 따른 농도모의 차이는 미세하게 나타났다.


Fig. 2. 
Statistical evaluation between the observed and predicted (a) hourly, (b) daily mean PM10 concentration during total analysis period at 35 monitoring site for D4.

사례일의 낮은 모의 정확도 원인을 분석하고자 기상요소에 대한 통계분석과 더불어 가중치 산정 기간과 사례일의 PM10 농도와 기상요소에 대한 Taylor diagram 분석을 실시하였다. Taylor diagram 분석 결과 (그림 3), 모의된 PM10 농도와 기상요소는 가중치 산정 기간보다 사례일에 상대적으로 낮은 상관계수와 표준편차비를 가지며 낮은 정확도를 보임을 확인하였다. 이때 사례일의 기상 입력 자료에 대한 통계분석 결과, 기온과 풍속의 MBE, RMSE, IOA는 0.38℃, 1.97℃, 0.91과 0.34 ms-1, 1.49 ms-1, 0.71로 계산 되어 미국 EPA에서 제시하는 기준지표범위와 비교하여 낮은 오차와 높은 일치도를 보이며 좋은 결과를 모의하였다. 반면, 습도의 경우 10.83%, 15.40%, 0.73으로 과대모의 경향이, 바람(U/V성분)의 경우 1.01/2.03 ms-1, 2.16/3.61 ms-1, 0.48/0.23으로 낮은 정확도가 나타났다.


Fig. 3. 
Taylor diagram plotted for meteorological factors (T2: temperature at 2 m, RH2: relative humidity at 2 m, WS10: wind speed at 10 m) and hourly, daily mean PM10 concentration during analysis periods (07~10 Mar, 2013; red) and weight periods (28 Feb~06 Mar, 2013; blue). The azimuthal position gives the correlation, while the radial distance from the origin is proportional to the normalized standard deviation. The distance between the observation and a given point is proportional to the root mean square error (RMSE) between the observations and the predicted having the correlation and standard deviation of the given point.

사례일의 낮은 정확도는 배출량과 PM10의 생성·소멸에 영향을 주는 습도와 풍향에 대한 불확실성으로 인한 결과로, 사례일에 발생한 중국발 PM10으로 인한 배출량의 불확실성 증가와 더불어 습도의 과대모의 경향으로 인하여 침적작용이 촉진되어 관측에 비해 낮은 PM10 농도를 모의한 것으로 보인다. 또한 부산지역은 지리적으로 해양에 인접해 있고, 산지가 많이 분포해 있어 시간별 풍향이 큰 변화를 보이며, 이때 풍향은 PM10의 수평이동에 영향을 준다. 기상 입력 자료가 평균적인 풍향의 변화는 잘 모의한 반면, 시간별 풍향의 변화를 잘 모의하지 못하였고, 따라서 시간별 농도에 대한 낮은 정확도가 나타난 것으로 사료된다. 이러한 사례일과 가중치 산정 기간의 예측정확도 차이로 인해 추후 가중치 산정에 있어 불확실성이 발생할 수 있다. 이에 과거에 발생한 중국발 PM10 사례일들에 대한 추가 학습을 통한 중국발 PM10 사례일의 특성 분석 및 사례일과 비사례일의 가중치 차이에 대한 분석이 선행되어야 한다.

시간 변동의 유사성과 공간적인 분포를 살펴보고자 시계열분석과 수평분포 분석을 실시하였다. 먼저 시계열분석 결과, 통계분석 결과와 동일하게 각 모델들은 과소모의 경향을 보였으며, 관측과 모델의 농도 차이는 사례일을 기점으로 2일 전부터 증가하여 사례일에 가장 크게 나타났다. 시간 변동의 경우, 시간별 농도와 일최고 농도는 관측과 유사하였으며, 특히 M01이 가장 관측과 유사한 결과를 나타냈다. 적용된 기상물리옵션에 따른 차이는 전반적으로 미미하였으나, 습도에 대해서는 Rapid Update Cycle (RUC) 지면물리옵션을 적용한 단일 모델이 야간의 습도 감소를 모의하지는 못하는 특징을 보였다. RUC 지면물리옵션은 토양변수로 기온, 얼음, 물+얼음을 제공하기 때문에 부산지역의 지면 성질을 모의하는 데 있어 불확실성이 존재한다. 수평분포 분석은 일평균 농도와 일 최고 농도에 대해 실시하였고, 전반적으로 모델들은 관측과 비교하여 낮은 농도를 보였으나, 관측의 공간적인 분포를 잘 모의하였다. 내륙에 형성된 강한 서풍의 영향으로 대상 지역 서쪽 외부에서 배출된 PM10이 유입되어 창원지역과 거제도 지역에서 상대적으로 높은 농도를 보였으며, 이는 해양에 형성된 남서풍을 타고 북동쪽으로 이동하여 해양 전역에 높은 농도를 형성하는 특징을 보였다. 또한 M01은 다른 단일 모델들과 다르게 도메인 전역, 특히 해상에서 높은 농도를 모의하는 특징을 보였다.

단일 모델 분석 결과, 전반적으로 낮은 모의 정확도를 보였지만, 선행연구 (Yoo et al., 2011; Kim, 2009)의 결과와 유사한 수준이며 일평균 농도에 대해 관측과 높은 상관성을 보였다. 또한 관측의 시·공간적 분포를 잘 모의하고 있으며, 모델 간의 편차가 크지 않아 앙상블 실험에 사용하는 데 있어 적합한 결과로 분석된다.

3. 2 앙상블 실험별 통계모델 산출 결과

앙상블 사이즈는 단일 모델 결과와 관측 자료의 RMSER (Root Mean Square Error Ratio)과 SDR (Standard Deviation Ratio)을 이용하여 RMSER이 1보다 작고 SDR이 1에 가까운 값이나 교차하는 값으로 산정된다. 이때 RMSER은 앙상블 개수에 따른 RMSE를 단일멤버의 RMSE로 나눈 값이며, SDR은 앙상블 개수에 따른 표준편차를 관측 자료의 표준편차로 나눈 값으로 RMSER과 SDR은 1을 기준으로 표 4와 같이 총 3가지 범위로 구분된다.

Table 4. 
Classification of RMSER and SDR.
RMSER SDR
<1 The accuracy of ensemble is higher than single member The standard deviation of ensemble is larger than observation
=1 The accuracy of ensemble and single member is same The standard deviation of ensemble and observation is same
>1 The accuracy of ensemble is lower than single member The standard deviation of ensemble is smaller than observation

앙상블 사이즈 산정 결과, RMSER은 앙상블 개수가 많아질수록 정확도가 높아지는 것으로 나타났으며, SDR은 1 이하로 관측에 비해 낮은 표준편차를 보이나, RMSER과 동일하게 앙상블 개수가 많아질수록 1에 가까워지며 정확도가 높아짐을 알 수 있었다. 따라서 가장 낮은 RMSER과 높은 SDR을 보인 12개를 앙상블 사이즈로 선정하였고, 이후 각각의 단일 모델을 앙상블 멤버라 칭하였다.

각 앙상블 실험별 통계모델은 표 5와 같이 산출되었으며, 이때 산출된 모델은 회귀분석 결과가 관측을 잘 나타내고 있으며 (R2), 유의수준 0.05에서 ‘모델이 유의하지 않다’라는 귀무가설을 기각하므로 (Pr>F) 통계적으로 유의함을 확인하였다. 군집별 가중치 평균을 이용한 실험의 경우, 기온, 습도, 풍속을 기준으로 각각 4개의 군집이 통계적으로 유의하게 나타났으나, 습도와 바람의 경우 일부 군집의 통계 값이 산출되지 않아 최소 제곱법의 결과가 고유 값을 갖지 않을 가능성이 제기되었고 일부 앙상블 멤버 값이 다른 값들의 선형 조합으로 이루어져 가중치가 0으로 계산되었다. 이에 따라 유사한 특징을 보인 군집으로 재편성을 실시하여 3개의 군집으로 분류하였고, 최종 분류 군집은 표 6과 같다.

Table 5. 
The results of statistical model calculated by each ensemble experiments.
Experiments Statistical model
EXP-A
EXP-SL
EXP-SS
EXP-CT Cluster1
Cluster2
Cluster3
Cluster4
EXP-CR Cluster1
Cluster2
Cluster3
EXP-CW Cluster1
Cluster2
Cluster3

Table 6. 
Classification standard for each cluster in T2, RH2, W10.
T2 (℃) RH2 (%) W10
U10 (m/s) V10 (m/s)
Cluster1 2≤T2<7 RH2<30 0<U10 V10≤0
Cluster2 7≤T2<12 45≤RH2 0≤U10 0<V10
Cluster3 T2<2 30≤RH2<45 U10≤0 -
Cluster4 12≤T2 - -

3. 3 앙상블 실험 분석 결과
3. 3. 1 공간분석 결과

각 앙상블 실험별 PM10 농도의 공간적인 분포를 파악하고자 일평균, 일 최고 농도의 수평분포를 분석하였다. 전반적으로 관측과 유사한 분포를 보였으나, 대상 영역 서쪽지역과 해양에 대해 각 앙상블 실험별 모의 차이가 나타남을 확인하였다. 보다 상세 분석을 위하여 사례일 중 단일 모델 간의 농도분포 차이가 가장 크게 나타난 3월 8일에 대한 일평균 농도와 일 최고 농도의 수평분포를 각각 그림 4그림 5에 나타냈다.


Fig. 4. 
Horizontal distribution of ensemble daily mean PM10 concentration for each experiments on 08 Mar, 2013.


Fig. 5. 
Horizontal distribution of ensemble daily maximum PM10 concentration for each experiments on 08 Mar, 2013, respectively.

일평균 농도 모의 결과 (그림 4), 앙상블 실험들은(EXP-A, EXP-SL, EXP-SS, EXP-CT, EXP-CR, EXP-CW) 전체 도메인에 대해 평균 22 μg/m3, 63 μg/m3, 33 μg/m3, 110 μg/m3, 45 μg/m3, 61 μg/m3의 농도를 보였다. 앙상블 방법에 따른 농도의 향상은 EXP-CR에서 가장 크게 나타났고 EXP-A에서 가장 작게 나타났다. 비가중치 평균과 비교하여 가중치 평균을 수행한 실험들은 전 도메인에 대해 높은 농도를 모의하여 과소모의 경향이 개선되었고, 특히 해양에서 농도 차이가 가장 크게 나타났다. 앙상블 실험별 M01의 기여도 차이로 인하여 대상영역 서쪽경계 외부로부터 유입된 PM10 영향의 차이가 발생하였고, 이는 내륙과 해양에 형성된 서풍과 남서풍을 따라 도메인 전역에 영향을 주었다. 일최고 농도 모의 결과 (그림 5), 앙상블 실험들은 전체 도메인에 대해 평균 31 μg/m3, 70 μg/m3, 40 μg/m3, 184 μg/m3, 58 μg/m3, 56 μg/m3의 농도를 보였다. 비가중치 평균과 비교하여 가중치 평균을 수행한 앙상블 실험들은 내륙에서 높은 농도를 모의하였으며, EXP-SL과 EXP-CT의 경우 해양에서도 높은 농도를 모의하며 과소모의 경향이 개선되었다. 앞선 일평균 농도와 마찬가지로 도메인 서쪽경계 외부로부터의 PM10 유입이 도메인 전역에 영향을 주었다.

특히 일 최고 농도에 대한 EXP-CT는 다른 실험들과 비교하여 다른 공간적 분포를 보였다. 기온을 기준으로 군집을 나누었을 때, 군집의 특징과 시간별 PM10 농도 간의 상관성이 매우 낮게 나타났고, 이에 따라 가중치 산정에 대해 불확실성이 증가하여 결과에 영향을 미쳤을 것으로 사료된다.

3. 3. 2 평균적/정량적 통계분석 결과

환경부는 대기오염으로 인한 국민 건강 피해를 최소화하기 위해 매일 4회 (오전 5시/11시, 오후 5시/11시)의 대기오염 농도 등급을 예측하여 에어코리아 (http://www.airkorea.or.kr)에 제시하고 있다. 이때 예측된 일평균 PM10 농도에 따라 총 4개의 등급, 좋음 (30 μg/m3 이하)/보통 (31~80 μg/m3)/나쁨 (81~150 μg/m3)/매우나쁨 (151 μg/m3 이상)으로 예보된다. 등급에 따라 각각 1/2/3/4점으로 산정하였을 때, 사례일의 경우 평균 3점으로 높은 등급을 보였고, 일반적으로 사용되는 비가중치 평균을 이용한 EXP-A의 경우 평균 1.5점으로 낮은 등급을 모의하였다. 가중치 평균을 이용한 실험들은 평균 2.5, 2.25, 2, 1.75점으로 EXP-CT, EXP-CW, EXP-CR·EXP-SL, EXP-SS 순으로 높은 등급을 모의하였으며, 가중치 산정 방법에 따른 개선효과는 군집별 가중치 평균을 사용하였을 때 가장 크게 나타났다.

그림 6은 앙상블 실험별 산정된 앙상블 결과에 대한 통계분석 결과이다. 전반적으로 단일 모델 결과와 비교하여 시간별 농도에 대해 정확도가 낮아졌으며, 앙상블 스프레드 (64.06 μg/m3)보다 높은 RMSE를 보이며 관측의 확률분포를 과소모의하고 있음을 알 수 있다. 반면, 일평균 농도에 대해서는 전반적으로 오차의 개선 및 일치도의 증가에 따른 높은 정확도를 보였으며 일부 실험의 경우 앙상블 스프레드 (38.85 μg/m3)보다 낮은 RMSE를 보이며 관측의 확률분포를 과대모의하고 있다.


Fig. 6. 
Statistical evaluation between the observed and (a) hourly, (b) daily ensemble mean PM10 concentration during total analysis period (28 Feb ~10 Mar, 2013) at 35 monitoring site for D4.

군집별 가중치 평균 방법을 이용한 실험의 경우, 시간별 농도에 대해 EXP-CR, EXP-CW, EXP-CT 순으로 낮은 오차와 높은 일치도가 나타났고, 앙상블 스프레드보다 작은 RMSE를 보임에 따라 신뢰성이 낮음을 알 수 있다. 이때 EXP-CT는 MBE와 RMSE의 차이가 크게 나타나 불안정성이 발견되었다. 반면, 일평균 농도는 EXP-CR, EXP-CT, EXP-CW 순으로 낮은 오차와 높은 일치도가 나타났다. 또한 전반적으로 앙상블 스프레드보다 낮은 RMSE를 보이며 앙상블 실험들이 높은 신뢰성을 보임을 알 수 있다. 따라서 앙상블 결과에 대한 대상인자의 영향은 분석요소별로 차별적으로 나타났으나, 전반적으로 습도를 기준으로 군집별 가중치 평균을 수행한 EXP-CR이 가장 높은 정확도를 보이며, 신뢰성 있는 결과를 나타냈다. 일반적으로 PM10의 발생, 수송, 침적과정에 기온, 바람, 습도가 복합적으로 영향을 준다. 하지만 군집별 가중치 산정을 위해 군집을 나누었을 때, 기온과 바람의 경우 군집별 특성과 PM10 농도의 1 : 1 상관성이 낮은 반면, 습도의 경우 1 : 1 상관성이 높음을 알 수 있다.

앙상블 결과에 대한 가중치 산정 방법에 따른 영향(EXP-SL, EXP-SS, EXP-CR)은 정확도가 가장 높았던 M01의 기여도 차이에 따라 상이하게 나타났다. 시간별 농도와 일평균 농도에 대하여 각각 EXP-SL과 EXP-CR이 가장 높은 정확도를 보이며 향상된 결과를 모의하였으나, EXP-SL이 EXP-CR보다 전반적으로 관측의 확률분포를 잘 모사하며 높은 신뢰성을 보였다. EXP-SL은 시간별 농도에 대해 앙상블 스프레드와 유사한 RMSE를 보이며 관측의 확률분포를 잘 표현하였고, 일평균 농도에 대해서는 낮은 RMSE를 보이며 과대모의하였다. 반면, EXP-CR은 시간별 농도에 대해 과소모의를, 일평균 농도에 대해서는 과대모의를 하였다. 따라서 가중치 평균 방법을 사용한 실험 중 EXP-SL이 정확도와 신뢰성에 있어 가장 좋은 결과로 분석된다.

마지막으로 앙상블 평균 방법에 따른 영향은 EXP-A보다 EXP-SL에서 크게 나타났다. 이때 EXP-A는 앞선 앙상블 멤버들의 평균값과 동일한 통계지표 값을 보이며 정확도가 가장 높았던 M01보다 낮은 정확도를 보였다. 또한 앙상블 스프레드보다 높은 RMSE를 보이며 관측의 확률분포보다 과대모의하였다.

결과적으로 앙상블 평균 방법의 경우 가중치 평균 방법을 이용하였을 때 더 높은 정확도와 신뢰성을 보였고, 일반적으로 널리 사용되어지는 다중 회귀 분석을 이용한 가중치 평균 방법이 가장 향상된 결과를 나타냈다.


4. 요약 및 결론

본 연구에서는 PM10 농도 예측에 있어 효과적인 앙상블 방법을 제시하고자 다양한 앙상블 방법에 따른 앙상블 결과의 통계적, 공간적 비교 분석을 실시하였다. 앙상블 평균 방법과 가중치 산정 방법에 따라 6개의 앙상블 실험을 구성하였고, 앙상블 멤버 구성을 위해 12개의 CMAQ 모델링 결과들을 이용하였다. 이때 각각의 CMAQ 모델링은 서로 다른 물리옵션을 적용한 기상 입력 자료를 사용하였다.

단일 멤버의 모사능력 평가 결과, 시간별 농도보다 일평균 농도에 대해 상대적으로 높은 정확도와 신뢰성을 보였다. 또한 단일 멤버들은 관측과 비교하여 과소모의 경향이 나타났으나, 관측의 공간적 분포특징을 잘 모의하고 모델 간의 편차가 크지 않아 앙상블 실험을 수행하기에 적합한 결과로 판단되었다. 이에 단일 멤버들의 RMSER과 SDR를 이용하여 12개의 앙상블 멤버를 선정하였고, 이를 이용하여 산출한 앙상블 실험별 통계모델은 통계적으로 유의한 모델임을 확인하였다.

앙상블 실험들은 단일 모델 결과와 비교하여 일평균 농도 모의에 대해 오차의 개선과 정확도 향상이 나타났으며 관측의 공간적 분포특징을 잘 모의하였으나, 앙상블 멤버의 기여도 차이에 따라 서쪽경계 외부로부터 유입된 PM10의 영향이 상이하게 나타났다. 앙상블 방법에 따른 PM10 모의 결과, 전반적으로 비가중치 평균보다 가중치 평균을 사용한 앙상블 실험들이 더 향상된 결과를 모의하였고 내륙에서 고농도 모의 경향이 뚜렷하게 나타났다. 이때 군집별 가중치 평균을 사용한 앙상블 실험들은 불안정성이 일부 발견되었다. 특히 기온을 기준으로 군집별 가중치 평균을 사용한 앙상블 실험의 경우, 다른 실험들과 비교하여 전체 가중치가 약 6~8배 정도 크게 산정됨에 따라 다른 실험보다 높은 농도를 보이며 관측과 유사한 농도를 보였으나, 높은 RMSE와 MBE 차이가 발생하여 불안정성이 가장 크게 나타났다. 가중치 평균 방법 및 산정방법에 다른 결과는 분석요소별로 상이하게 나타났다. 시간별 농도와 일평균 농도에 대해 각각 단일 가중치 평균 (다중 회귀 분석)을 이용한 앙상블 실험과 습도를 기준으로 한 군집별 가중치 평균을 이용한 앙상블 실험이 가장 높은 정확도를 보였으나 단일 가중치 평균 방법 (다중 회귀 분석)이 상대적으로 높은 신뢰성을 보이며 가장 향상된 결과로 분석되었다.

앙상블 방법에 따른 효과는 전반적으로 단일 가중치 평균 방법 (다중 회귀 분석)을 이용하였을 때 가장 크게 나타났다. 이는 단기간의 사례일을 대상으로 수행되어진 결과로 계절적 특성을 반영하지 않으며, 기상현상에 대한 해석이 제한적이다. 이에 따라 모의하고자 하는 사례일의 특성에 따라 결과가 달라질 수 있다. 하지만 본 연구 결과는 다양한 앙상블 방법에 따른 차이를 분석하고 효과적인 앙상블 방법을 제시함에 따라 앙상블 실험 수행에 있어 기초정보로 활용될 수 있을 것으로 판단된다. 향후 배출량 정확도 개선과 더불어 다양한 사례와 장기간 모델링에 대한 검증이 이루어진다면 예측에 있어 불확실성이 감소되어 보다 향상된 결과를 도출할 수 있을 것으로 예상된다.


Acknowledgments

이 논문은 2015년도 정부 (미래창조과학부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업입니다 (NRF-2015R1A2A1A10053971).


References
1. Baker, L., A. Rudd, S. Migliorini, and R. Bannister, (2014), Representation of model error in a convective-scale ensemble prediction system, Nonlinear Processes in Geophysics, 21, p19-39.
2. Djalalova, I., J. Wilczak, S. McKeen, G. Grell, S. Peckham, M. Pagowski, L. DelleMonache, J. McQueen, Y. Tang, P. Lee, J. McHenry, W. Gong, V. Bouchet, and R. Mathur, (2010), Ensemble and bias-correction techniqeus for air quality model forecsts of surface O3 and PM2.5 during the TEXAQS-Ⅱ experiment of 2006, Atmospheric Environment, 44, p455-467.
3. Epstein, E.S., (1969), Stochastic dynamic prediction, Tellus, 21, p739-759.
4. Huijnen, V., H.J. Eskes, A. Poupkou, H. Elbern, K.F. Boersma, G. Foret, M. Sofiev, A. Valdebenito, J. Flemming, O. Stein, A. Gross, L. Fobertson, I.M. D’Isidoro, Kioutsioukis, E. Friese, B. Amstrup, R. Bergstrom, A. Strunk, J. Vira, D. Zyryanov, A. Maurizi, D. Melas, V.-H. Peuch, and C. Zerefos, (2010), Comparison of OMI NO2 tropospheric columns with an ensemble of global and European regional air quality models, Atmospheric Chemistry and Physics, 10, p3273-3296.
5. Jang, I.-S., D.-G. Lee, J.A. Yu, S.-C. Hong, J.-S. Son, and J.-Y. Choi, (2014), PM10 forecasting status and improvement measures, Proceedings of the Spring Meeting of KMS.
6. Kim, D.Y., (2009), PM analysis using CMAQ in Seoul metropolitan area, Policy research, 6, p1-43, (in Korean with English abstract).
7. Kim, S.H., H.M. Kim, J.K. Kay, and S.-W. Lee, (2015), Development and Evaluation of the high resolution limited area ensemble prediction system in the Korea Meteorological Administration, Atmosphere, Korean Meteorological Society, 25(1), p67-83, (in Korean with English abstract).
8. Leith, C.E., (1974), Theoretical skill of Monte Cario forecasts, Monthly Weather Review, 102, p409-418.
9. Mckeen, S., J. Wilczak, G. Grell, I. Djalalova, S. Peckham, E.-Y. Hsie, W. Gong, V. Bouchet, S. Menard, R. Moffect, J. McHenry, J. McQueen, Y. Tang, G.R. Carmichael, M. Pagowski, A. Chan, T. Dye, G. Frost, P. Lee, and R. Mthur, (2005), Assessment of an ensemble of seven real-time ozone forecasts over eastern North America during the summer of 2004, Journal of Geophysical Research, 110.
10. Monache, L.D., and R.B. Stull, (2003), An ensemble air-quality forecast over western Europe during an ozone episode, Atmospheric Environment, 37, p3469-3474.
11. Monache, L.D., J.P. Hacker, Y. Zhou, X. Deng, and R.B. Stull, (2006), Probabilistic aspects of meteorological and ozone regional ensemble forecasts, Journal of Geophysical Research, 11.
12. Monteiro, A., I. Ribeiro, O. Tchepel, E. Sá, J. Ferreira, A. Carvalho, V. Martins, A. Strunk, S. Galmarini, H. Elbern, M. Schaap, P. Builtjes, A.I. Miranda, and C. Borrego, (2013), Bias correction techniques to improve air quality ensemble predictions: Focus on O3 and PM over Portugal, Environmental Modeling & Assessment, 18(5), p533-546.
13. Moon, Y.-S., Y.-K. Lim, and K. Lee, (2011), An estimation of concentration of asian dust (PM10) using WRF-SMOKE-CMAQ (MADRID) during springtime in the Korean Peninsula, Journal of the Korean Earth Science Society, 32(3), p276-293, (in Korean with English abstract).
14. National Institute of Environmental Research, (2014), Studies on the optimization method for improving the accuracy of air quality modeling, Korea.
15. Pagowski, M., G.A. Grell, D. Devenyi, S.E. Peckham, S.A. Mckeen, W. Gong, L.D. Monache, J.N. McHenry, J. McQueen, and P. Lee, (2006), Application of dynamic linear regression to improve the skill of ensemble-based deterministic ozone forecasts, Atmospheric Environment, 40, p3240-3250.
16. Shin, H.-J., Y.-J. Lim, J.-H. Kim, H.-J. Jung, S.-M. Park, J.-S. Park, I.-H. Song, S.-J. Seo, Y.-D. Hong, and J.-S. Han, (2014), The characteristics of long term high PM episode occurred in Feb. 2014, Journal of the Korean Society of Urban Environment, 14(3), p223-232, (in Korean with English abstract).
17. Solazzo, E., R. Bianconi, R. Vautard, K.W. Appel, M.D. Moran, C. Hogrefe, B. Bessagnet, J. Brandt, J.H. Christense, C. Chemel, I. Coll, H.D. Gon, J. Ferreira, R. Forkel, X.V. Francis, G. Greel, P. Grossi, A.B. Hansen, A. Jeričević, L. Kraljevic, A.I. Miranda, U. Nopmongcol, G. Provano, M. Prank, A. Riccio, K.N. Sartelet, M. Schaap, J.D. Silver, R.S. Sokhi, J. Vira, J. Verhahn, R. Wolke, G. Yarwood, J. Zhang, S.T. Rao, and S. Galmarini, (2012), Model evaluation and ensemble modeling of surface-levle-ozone in Europe and North America in the context of AQMEII, Atmospheric Environment, 53, p60-74.
18. Vautard, R., M. Schapp, R. Mergström, B. Bessagnet, J. Brandt, P.J.H. Builtjes, J.H. Christensen, C. Cuvelier, V. Foltescu, A. Graff, A. Kerschbaumer, M. Krol, P. Roberts, L. Rouïl, R. Sern, L. Tarrason, P. Thunis, E. Vignati, and P. Wind, (2009), Skill and uncertainty of a regional air quality model ensemble, Atmospheric Environment, 43, p4822-4832.
19. Yoo, C., D. Lee, Y. Lee, M.-H. Lee, J. Hong, and S. Lee, (2011), Methodology of application to air quality model to evaluate the results of the enforcement plan in Seoul metropolitan area, Journal of the Environmental Sciences, 20(12), p1647-1661, (in Korean with English abstract).
20. Žabkar, R., D. Koračin, and J. Rakovec, (2013), A WRF/Chem sensitivity study using ensemble modeling for a high ozone episode in Slovenia and the Northern Adriatic area, Atmospheric Environment, 77, p990-1004.