비접촉식 화학작용제 탐지용 라만 분광계를 위한 Denoising Autoencoder 기반 잡음제거 기술

Denoising Autoencoder based Noise Reduction Technique for Raman Spectrometers for Standoff Detection of Chemical Warfare Agents

Article information

J. KIMS Technol. 2021;24(4):374-381
Publication date (electronic) : 2021 August 05
doi : https://doi.org/10.9766/KIMST.2021.24.4.374
1) School of Electrical Engineering, Korea Advanced Institute of Science and Technology, Korea
2) The 4th Research and Development Institute, Agency for Defense Development, Korea
이창식1), 유형근1), 박재현1), 김휘민1), 박동조1), 장동의,1), 남현우2)
1) 한국과학기술원 전기및전자공학부
2) 국방과학연구소 제4기술연구본부
Corresponding author, E-mail: dechang@kaist.ac.kr
Received 2021 March 05; Revised 2021 April 07; Accepted 2021 June 04.

Abstract

Abstracts

Raman spectrometers are studied and developed for the military purposes because of their nondestructive inspection capability to capture unique spectral features induced by molecular structures of colorless and odorless chemical warfare agents(CWAs) in any phase. Raman spectrometers often suffer from random noise caused by their detector inherent noise, background signal, etc. Thus, reducing the random noise in a measured Raman spectrum can help detection algorithms to find spectral features of CWAs and effectively detect them. In this paper, we propose a denoising autoencoder for Raman spectra with a loss function for sample efficient learning using noisy dataset. We conduct experiments to compare its effect on the measured spectra and detection performance with several existing noise reduction algorithms. The experimental results show that the denoising autoencoder is the most effective noise reduction algorithm among existing noise reduction algorithms for Raman spectrum based standoff detection of CWAs.

1. 서 론

화생방 상황 발생 시 화학적 위협으로 인한 피해를 최소화하기 위해서는 화학물질의 신속한 탐지 및 대처가 필요하다. 하지만 유독성 화학작용제 중에는 무색, 무취의 특성을 가진 물질이 많기 때문에 가시광선 이외의 파장 대역에서 화학작용제를 찾는 비접촉식 탐지기술의 필요성이 점점 대두되고 있다[1].

그러한 탐지기술 중 하나로써, 모든 상태의 물질을 비파괴적으로 분석할 수 있는 비접촉식 라만 분광계(Raman Spectrometer)가 연구되고 있다[2]. 라만 분광계는 레이저를 물질에 조사할 때 발생하는 물질의 라만 산란광을 측정하는 장비이다. 라만 산란광의 스펙트럼이 물질의 분자구조 및 특성에 따라 고유한 형태를 띠기 때문에 라만 분광계는 화학작용제 탐지에 유용하게 사용될 수 있다[3]. 구체적으로, 유독성 화학작용제가 지표면에 살포된 상황에서 이를 신속히 탐지하기 위해 차량에 라만 분광계를 탑재하여 차량 이동 중에 지표면의 라만 스펙트럼을 측정하고 화학작용제에 오염된 영역을 판단하는 시스템[4]이 군사적으로 연구되고 있다.

라만 분광계로 획득한 라만 스펙트럼은 배경 신호, 검출기의 내재적인 문제 등 여러 이유로 인해 잡음 성분을 포함하고 있다[5]. 이러한 잡음 성분 때문에 라만 분광계는 화학작용제의 명확한 특징 파형을 확보하기 어렵다[6]. 따라서 비접촉식 라만 분광계 기반 유독성 화학작용제 탐지 시스템에서 실용적인 탐지성능을 확보하기 위해서는 라만 스펙트럼에서 랜덤 잡음을 제거하는 과정이 필요하다.

라만 분광계로 측정한 라만 스펙트럼의 잡음을 제거하는 방법으로는 기존 초분광 스펙트럼 연구의 잡음제거 기법을 라만 스펙트럼에 응용하는 연구[5,79]를 주로 찾아볼 수 있다. 하지만 일부 라만 분광계 적용 분야에서는 기존 초분광 스펙트럼의 잡음제거 연구와 차이를 보이는 부분이 있다. 일반적으로 초분광 스펙트럼의 잡음제거는 복수의 스펙트럼 표본을 이용하여 잡음을 제거하는 방법이 주를 이룬다[10]. 반면에 차량 이동 중에 지표면에 살포된 화학작용제의 라만 스펙트럼을 측정하는 탐지 시스템의 연구에서는 실적용 상황을 가정할 때 동일 대상에 대해 복수의 라만 스펙트럼 표본을 획득하기 어려우므로 단일 스펙트럼만을 이용한 잡음제거 기법을 적용하는 연구[11]가 이루어진다. 따라서 기존 초분광 스펙트럼 연구에서 단일 스펙트럼만으로 잡음을 제거하기 위한 잡음제거 기법인 Savitzky-Golay 필터(S-G filter), 푸리에 변환, 이동 평균, 중간값 필터 등을 라만 스펙트럼에 응용하는 연구[5,79]가 수행되었다.

심층 학습의 발전과 함께 인공 신경망 기반 잡음제거 기법인 denoising autoencoder(DAE)를 라만 스펙트럼의 잡음제거에 적용하는 연구[12]도 수행되었다. DAE 의 학습을 위해서는 잡음이 없는 표본과 잡음이 있는 표본을 모두 보유한 데이터셋을 확보해야 한다[13]. 해당 연구에서는 높은 출력의 레이저로 측정한 라만 스펙트럼을 잡음이 없는 표본으로 가정하고, 낮은 출력의 레이저로 측정한 라만 스펙트럼을 잡음이 있는 표본으로 가정하여 DAE를 학습한다[12]. 하지만 상기 접근법은 서로 다른 출력을 가진 두 개 이상의 레이저를 보유한 상황에서만 유효하며, 단일 출력 레이저만 보유한 경우 상기 접근법을 적용할 수 없다는 한계점을 가지고 있다.

본 논문은 단일 출력 레이저만 보유한 상황에서 확보할 수 있는 라만 스펙트럼 데이터셋으로 DAE를 효율적으로 학습하기 위한 방법을 제안한다. 단일 출력 레이저로 측정한 라만 스펙트럼 표본에는 잡음이 존재하며, 잡음이 있는 라만 스펙트럼 표본만으로 잡음제거 기능을 학습하기 위한 방법으로써 데이터셋 내 인근 표본의 정보를 표본 효율적으로 활용하는 손실 함수를 제안한다. 이를 통해 이동 중인 차량에서 라만 분광계로 지표면에 살포된 화학작용제의 라만 스펙트럼을 측정하는 탐지 시스템을 위한 DAE 기반 라만 스펙트럼 잡음제거 알고리즘을 구현한다. 실험을 통해 기존 라만 스펙트럼 잡음제거 알고리즘과 비교하여 잡음제거 전/후 라만 신호의 성질 변화를 분석한다. 나아가 각 잡음제거 알고리즘마다 탐지 알고리즘을 적용하여 잡음제거 전/후 탐지성능 변화를 분석한다. 실험 결과, DAE 기반 라만 스펙트럼 잡음제거 알고리즘은 다른 잡음제거 알고리즘에 비해 탐지 성능 향상에 가장 효과적인 것을 확인하였다.

2. Denoising Autoencoder 기반 라만 스펙트럼 잡음제거 기법

본 논문에서는 단일 라만 스펙트럼 정보만을 이용하여 라만 스펙트럼의 잡음을 제거하기 위한 알고리즘을 설명한다. 비접촉식 라만 분광계로 측정한 N개의 라만 스펙트럼 표본을 가진 데이터셋이 총 C 종의 화학작용제를 포함하고 있으며, 각 화학작용제 마다 Ni,i=0,,C-1 개의 라만 스펙트럼 표본을 보유하고 있다고 가정한다. 즉, N=i=0C-1Ni 이다. 라만 스펙트럼 측정 신호 xRm는 다음과 같이 순수 라만 신호 sR+m와 잡음 신호 vRm의 선형 결합으로 나타낼 수 있다.

(1)X=s+v,

여기서 잡음 신호 v를 가우시안 랜덤 벡터 v~N(0, Qn)라 가정할 때, 라만 스펙트럼 측정 신호 x는 가우시안 랜덤 벡터 x~N(s, Qn)이다. 그리고 QnRm×m은 공분산 행렬이다.

라만 스펙트럼 잡음제거 알고리즘은 라만 스펙트럼 측정 신호 x를 입력받아, 신호 x보다 높은 신호대잡음비(Signal-to-Noise Ratio, SNR)를 가진 라만 스펙트럼  x^Rm을 출력하는 것이 목적이다. 이를 위한 DAE 기반 잡음제거 기법은 Fig. 1과 같이 심층 신경망(Deep Neural Network, DNN)인 부호기(encoder)와 복호기(decoder)로 구성된다[13]. 부호기 fθ는 측정된 라만 스펙트럼 x를 입력받아, 입력 자료의 고유 라만 산란 특징을 가진 특징 벡터 z=fΘ(x)Rk를 출력하고, 복호기 gθ는 특징 벡터 z를 입력받아 잡음이 제거된 라만 스펙트럼 x^=gΘ(z)을 출력한다.

Fig. 1.

The structure of denoising autoencoder(DAE)

기존 DAE[12]는 다음 손실 함수를 최소화하는 방향으로 학습한다,

L=gθ(fθ(x))-y2,

여기서 yRm는 표본 x와 동일한 대상에 대해 확보한 잡음이 없는 표본이다. 따라서 DAE 학습을 위해서는 동일한 대상에 대해 잡음이 없는 표본 y와 잡음이 있는 표본 x를 필요로 한다. 보통 이러한 데이터셋을 확보하기 위한 방법으로써, 잡음이 없는 표본과 잡음이 있는 표본을 모두 확보하거나[12], 잡음이 없는 표본을 확보한 후 인위적으로 잡음을 추가하여 잡음이 있는 표본을 확보하는 방법[13]을 따른다. 하지만 라만 분광계는 발광 출력 대비 신호의 세기가 약한 라만 스펙트럼을 측정하기 때문에 단일 출력 레이저만으로는 잡음이 없는 표본을 확보하기 어렵다[6]. 게다가, 라만 분광계를 이용한 라만 스펙트럼 표본 확보는 상당한 시간 및 전문적인 인력 자원을 소요하기 때문에 일반적인 인공신경망의 학습을 위한 데이터셋처럼 다양한 환경에서 많은 양의 표본을 확보하기 어렵다. 따라서 단일 출력 레이저만 보유한 상황에서 라만 스펙트럼의 잡음제거를 위한 DAE를 학습하기 위해서는 잡음이 있는 데이터셋만으로 표본 효율적으로 잡음제거 기능을 학습할 방법을 찾아야 한다.

본 논문에서 제안하는 DAE 기반 잡음제거 기법은 잡음을 가진 데이터셋에서 잡음제거 기능을 학습하는 문제를 해결하기 위해 동일한 대상에 대해 여러 라만 스펙트럼 표본을 측정한 후, 표본 간 공통 정보를 활용한다. 구체적으로, 데이터셋 내 i번째 화학작용제에 대한 j번째 라만 스펙트럼 표본 xi,j와 해당 화학작용제의 라만 스펙트럼 표본 k-1개로 구성된 집합 Xi,j={Xi,lm|l=j-k-12+γ,0γk-1,γ}는 동일한 라만 스펙트럼 s를 측정한 표본들의 집합이라 가정한다, 여기서 k는 홀수이다. 이때 집합 X내 각 표본들 간 차이는 랜덤 잡음 v에 의해 결정되며, 각 표본에서 잡음을 제거한 결과의 집합 X^i,j = {x^i,l Rm|x^i,l=gΘ(fΘ(xi,l)), xi,lXi,j} 내 성분은 모두 서로 동일해야 한다. 이를 구현하기 위해 다음의 손실 함수 LConsistency를 이용한다,

(2) LConsistency=1Ni=0C-1j=0Ni-1l=0k-1X^i,j-k-12+l-Xi,j2,

여기서 N>0 은 데이터셋 내 표본의 총 개수를 의미한다. 상기 손실 함수로 인해 DAE는 각 라만 스펙트럼 표본 xi,j마다 인근 라만 스펙트럼 표본들의 집합 Xi,j에서 공통적인 특징을 추정하도록 학습한다. 여기서 손실 함수를 평균제곱오차(mean square error)로 계산한 이유는 평균절대오차(mean absolute error)보다 평균제곱오차가 실험적으로 더 좋은 성능을 보이기 때문이다.

또 다른 문제는 라만 스펙트럼 데이터셋 내 환경 다양성 및 표본의 양이 제한적이라는 것이다. 제한적인 환경에서 측정한 라만 스펙트럼 표본만으로 일반적인 데이터에 대해서도 유효한 잡음제거 성능을 학습시키기 위해 다음과 같은 triplet 손실 함수[14] LTriplet를 적용한다,

(3) LTriplet=1Nj=0N-1σ(pj-zj2 - nj-zj2 + α),

여기서 zj = fθ(xj)는 j번째 라만 스펙트럼 표본 xj에 대한 DAE의 특징 벡터이다. pjRkxj와 동일한 화학작용제에 속한 임의의 라만 스펙트럼 표본에 대한 특징 벡터, njRkxj와 다른 화학작용제에 속한 임의의 라만 스펙트럼 표본에 대한 특징 벡터를 나타낸다. 상수 α는 0보다 크거나 같은 임의의 실수이며, σ는 다음과 같이 정의한다,

σ(x)={xifx>0,0otherwise.

식 (3)의 손실함수는 동일 화학작용제의 특징벡터 간 유클리드 거리는 최소화하고, 서로 다른 화학작용제의 특징벡터 간 유클리드 거리를 최대화한다. 이를 통해 DAE의 부호기 fθ가 입력된 화학작용제의 특성을 특징벡터에 반영하도록 직접적으로 학습시킨다. 결과적으로 학습 데이터셋에 없는 환경에서 측정한 라만 신호에 대해서도 DAE가 입력된 화학작용제를 인지하고, 잡음이 없는 화학작용제의 스펙트럼을 복원할 수 있도록 만든다. triplet 손실 함수에 대한 더 자세한 설명은 관련 논문[14]을 참고한다.

본 논문에서 제안하는 DAE는 식 (2)식 (3)의 선형 결합으로 이루어진 다음 손실 함수로 학습한다,

(4)L=λConsistencyLConsistency+λTripletLTriplet,

여기서 λConsistencyλTriplet은 각 손실함수의 가중치이다.

3. Denoising Autoencoder 실험 결과

2장에서 설명한 DAE 기반 잡음제거 알고리즘을 실제 측정한 라만 스펙트럼에 적용하고 성능을 평가한다. 실험 자료는 삼양화학에서 제작한 비접촉식 자외선 라만 분광 장비 KRAMS[2]로 측정한다. 아스팔트, 콘크리트, 유리 총 3종의 배경 물질 위에 GF(cyclosarin), HN3(nitrogen mustard), MES(mecetronium ethylsulfate) 총 3종의 화학작용제를 약 2 µℓ 만큼 뿌린 다음 292.92 cm-1 ∼ 3654.98 cm-1의 파수 범위에서 1024개 값에 대한 라만 스펙트럼을 측정한다. 각 배경물질 및 화학작용제마다 500개의 스펙트럼을 측정하여 학습 데이터셋을 구성한다. 이후, 각 배경물질 및 화학작용제마다 100개의 스펙트럼을 추가로 측정하여 시험 데이터셋을 구성한다.

3.1 DAE의 학습

DAE는 각각 3층 신경망으로 이루어진 부호기와 복호기로 구성되어 있으며, 각 층의 설정은 Table 1과 같다. 식 (2)의 윈도우 크기 k는 3으로 설정하였다. 여기서 k의 크기는 DAE 성능에 큰 영향을 미치지 않으며, k가 커질수록 학습 시간이 늘어난다. DAE는 배경물질 및 화학작용제마다 500개의 스펙트럼 표본을 측정하여 확보한 학습 데이터셋으로 학습한다. GPU는 NVIDIA Titan X를 사용하며, 코드는 Python3 환경에서 Tensorflow를 이용하여 구현한다. 식 (3)α는 0.5로 설정하고, 식 (4)λConsistency, λTriplet는 1로 설정한다. 학습률은 10-3, 정규화는 L2 정규화이며 정규화 계수 λ는 10-6, 드롭아웃 확률은 0.35로 설정한다. 또한 학습률 스케줄은 Stochastic Gradient Descent with Warm Restarts(SGDR)[15]을 사용하고 최적화기법은 Adaptive moment estimation(Adam)[16]을 사용한다. 상기 파라미터 설정 하에 총 1270 epoch을 거쳐 30분 동안 학습을 수행하였다. 학습 과정 중 학습 손실 함수와 검증 손실 함수의 변화 그래프는 Fig. 2와 같다. 학습이 진행됨에 따라 학습 손실 함수 값이 약 0.12로 수렴하고 검증 손실 함수 값은 0.13으로 수렴한다.

Parameters of the denoising autoencoder

Fig. 2.

Loss curves of the proposed DAE over 1270 epochs of the trianing process. The solid black line is the training loss curve and the blue dotted line is the validation loss curve

3.2 비교대상 잡음제거 알고리즘

학습이 완료된 DAE의 성능을 확인하기 위해 기존의 라만 스펙트럼 잡음제거 알고리즘과 성능을 비교한다. 단일 라만 스펙트럼 정보만으로 잡음을 제거하기 위해 연구된 알고리즘으로는 S-G 필터[5], 푸리에 변환[7], 이동 평균[8], 중간값 필터[9]가 있다.

S-G 필터(Savitzky-Golay filter, S-G filter) 기반 잡음제거 기법은 스펙트럼 내의 한 점을 기준으로 인근 k개의 점을 선택하고, 이를 근사하는 n차 다항식을 찾음으로써 잡음 성분이 제거된 스펙트럼 값을 추정한다[5]. 윈도우에 들어갈 스펙트럼 값의 개수 k와 다항식 차수 n을 이용하여 계수행렬 M을 계산할 수 있고, 슬라이딩 윈도우(sliding window) 방식으로 모든 스펙트럼 값에 대해 계수행렬 M과 합성곱(convolution) 연산을 적용함으로써 잡음이 제거된 스펙트럼 X^을 획득한다.

푸리에 변환(Fourier Transform, FT) 기반 잡음제거 기법은 일반적으로 랜덤 잡음에서 고주파수 성분이 신호에 영향을 많이 준다는 특징을 기반으로, 라만 스펙트럼에 고속 푸리에 변환을 적용하여 주파수 영역에서 표현한 후, k개의 저주파수 성분을 취하고 고속 푸리에 역변환을 적용하여 잡음이 제거된 스펙트럼 X^을 획득한다[7].

이동 평균(Moving Average, MA) 기반 잡음제거 기법은 스펙트럼 내의 한 점을 기준으로 인근 k개의 점을 선택하고, 해당 점들의 평균값을 계산하여 잡음 성분이 제거된 스펙트럼 값을 추정한다[8]. 슬라이딩 윈도우 방식으로 모든 스펙트럼 값에 대해 윈도우 내 평균값을 계산하여 잡음이 제거된 스펙트럼  X^을 획득한다.

중간값 필터(Median Filter, MF) 기반 잡음제거 기법은 스펙트럼 내의 한 점을 기준으로 인근 k개의 점을 선택하고, 해당 점들의 중간값을 계산하여 잡음 성분이 제거된 스펙트럼 값을 추정한다[9]. 슬라이딩 윈도우 방식으로 모든 스펙트럼 값에 대해 윈도우 내 중간값을 계산하여 잡음이 제거된 스펙트럼 X^을 획득한다.

정리하면, 본 논문에서는 각 배경물질 및 화학작용제마다 100개의 스펙트럼을 측정한 라만 스펙트럼 시험 데이터셋을 이용하여 잡음제거 알고리즘을 적용하지 않은 경우인 Raw와 함께 S-G filter, FT, MA, MF, DAE (C), DAE (CT) 6개의 잡음제거 알고리즘을 적용한 경우를 합쳐 총 7개의 경우에 대해 신호 특성 및 작용제 탐지 성능을 확인한다. 여기서 DAE (C)는 식 (2)의 손실 함수 LConsistency만으로 학습한 DAE를 의미하고, DAE (CT)는 식 (4)를 따라 LConsistencyLTriplet 모두 이용하여 학습한 DAE를 의미한다. 두 가지 경우에 대해 DAE의 성능을 비교함으로써 식 (3) 손실 함수 LTriplet의 효과를 확인한다. 이때 각 잡음제거 알고리즘 별 파라미터는 다음 Table 2와 같이 설정한다.

Parameter settings for noise reduction algorithms

3.3 스펙트럼 형태 비교

잡음제거 알고리즘의 잡음제거 성능을 비교하기 위해 먼저 잡음제거 전/후 스펙트럼의 형태를 비교한다. 비교 대상으로 사용하는 화학작용제는 신경 화학작용제의 일종인 GF이다. GF의 라만 스펙트럼은 458 ∼ 1705 cm-1 대역과 2626 ∼ 3093 cm-1 대역에 특징 파형을 보유하고 있다. Fig. 3은 아스팔트 배경에 대해 측정한 GF 작용제 라만 스펙트럼 표본과 각 잡음제거 알고리즘 적용 결과를 보여준다. Fig. 3 (a)는 아스팔트 배경 위 GF 작용제의 라만 스펙트럼을 측정한 표본이다. Fig. 3 (b) ∼ (g)는 각 잡음제거 알고리즘을 적용하여 획득한 라만 스펙트럼이다. Fig. 3 (a)의 스펙트럼 형태와 Fig. 3 (b) ∼ (g)의 잡음이 제거된 스펙트럼 형태를 비교하면 스펙트럼 값의 분산이 감소한 것을 확인할 수 있다. Fig. 3 (a) ∼ (g) 중에서 스펙트럼 값의 분산이 제일 작은 것은 Fig. 3 (f) ∼ (g)의 DAE (C)와 DAE (CT)로 잡음이 제거된 라만 신호이다.

Fig. 3.

Visual comparison of GF spectra for the test cases (a) Raw GF spectrum, (b) S-G filter, (c) FT, (d) MA, (e) MF, (f) DAE (C), (g) DAE (CT)

3.4 탐지 성능지표를 이용한 비교

각 잡음제거 알고리즘이 화학작용제 탐지 성능에 미치는 영향을 평가하기 위해 일반 우도비 검정(Generalized Likelihood Ratio Test, GLRT)[17] 탐지 알고리즘을 사용하고, 전체 정확도(Overall Accuracy, OA)를 사용한다.

탐지 알고리즘인 GLRT는 라만 스펙트럼 x 를 선형 부분공간 모델[11]로 가정한 후, 검정통계 T(X)를 다음 식을 따라 계산한다.

T(X)=XTP1KX-XTP1KbgXXTP1KbgX

여기서 직교 투영 행렬 P1KRm×m, P1KbgRm×m는 이P1K=I-K(KTK)-1K, P1Kbg=I-Kbg(KbgTKbg)-1Kbg다. 그리고 행렬 KRm×(C+B)KbgRm×B 는 라이브러리 행렬로, K는 화학작용제 C개 및 배경 신호 B개의 표준 라만 스펙트럼으로 이루어져 있고 Kbg는 배경 신호 B개의 표준 라만 스펙트럼으로 이루어져 있다. GLRT에 대한 더 자세한 설명은 관련 논문[17]을 참고한다.

탐지 성능지표인 OA는 모든 종류의 화학작용제에 대한 탐지 정확도를 의미하며, 다음과 같이 계산한다.

OA=1Nj=0N-11hj=hj,

여기서 hj∈{0, 1}는 j번째 라만 스펙트럼 표본이 작용제인지 아닌지 나타내는 참값이며, h^j{0, 1}j번째 라만 스펙트럼 표본에 대한 작용제 탐지 결과이다. 동일한 탐지 알고리즘에 대해 잡음제거 알고리즘을 비교할 때, OA가 높을수록 해당 잡음제거 알고리즘의 잡음제거 성능이 좋다고 할 수 있다.

Table 3은 모든 화학작용제에 대해 각 배경 물질마다 GLRT에 대한 탐지 성능지표 계산 결과를 보여준다. 어떠한 배경에서도 잡음제거 알고리즘을 적용하면 탐지 성능이 Raw보다 향상되는 것을 확인할 수 있다. 특히 DAE (CT)는 모든 탐지 성능지표에서 다른 알고리즘보다 훨씬 향상된 수치를 보인다. 식 (2)의 손실 함수 LConsistency만 적용한 DAE (C)도 기존 라만 스펙트럼 잡음제거 알고리즘에 비해 높은 성능 수치를 보이지만, 식 (3)의 손실 함수 LTriplet까지 적용한 DAE (CT)보다는 낮은 성능 수치를 보인다.

Performances of the GLRT detector with the noise reduction methods for each background

3.5 손실 함수에 대한 실험

본 실험에서는 학습자료 개수에 따른 DAE 성능변화를 확인함으로써 손실 함수 LTriplet의 효과를 확인한다. Fig. 4는 학습 데이터셋 내 각 작용제 당 스펙트럼 표본의 개수를 변화시키면서 DAE를 학습시키고, GLRT 탐지 정확도를 비교한 결과이다. 작용제 당 100∼500개의 학습자료를 사용할 때에는 학습자료 개수가 늘어남에 따라 성능 향상을 보이며, 이때 DAE (CT)의 성능수치가 DAE (C)보다 높은 것을 확인할 수 있다.

Fig. 4.

Comparison of test accuracies over different training dataset sizes

4. 결 론

본 논문은 단일 출력 레이저만 보유한 제한적인 상황에서 비접촉식 라만 분광계 시스템을 위한 denoising autoencoder 기반 잡음제거 알고리즘을 제안한다. 이를 위해 데이터셋 내 표본 간 공통 정보를 활용하고, 메트릭 러닝 기법을 적용하여 표본이 제한적인 데이터셋을 효율적으로 활용하기 위한 손실 함수를 제안한다. 실험을 통해 denoising autoencoder 기반 잡음제거 알고리즘과 기존 라만 스펙트럼 잡음제거 알고리즘인 Savitzky-Golay filter, Fourier transform, moving average, median filter 간 비교를 수행한다. 실험 결과, 비교 대상 잡음제거 알고리즘 중 제안한 손실 함수로 학습한 denoising autoencoder가 화학작용제 탐지 성능 향상에 제일 효과적인 것으로 나타난다.

후기

본 연구는 국방과학연구소의 연구비 지원으로 수행되었습니다.(계약번호: UD190007GD)

References

[1]. Fountain A. W. 3, et al. Long Range Standoff Detection of Chemical, Biological and Explosive Hazards on Surfaces Proc. SPIE 7679, Micro- and Nanotechnology Sensors, Systems, and Applications II, 76790H. 2010.
[2]. Ha Y. C., Lee J. H., Koh Y. J., Lee S. K., Kim Y. K.. Development of an Ultraviolet Raman Spectrometer for Standoff Detection of Chemicals. Current Optics and Photonics 1(3):247–251. 2017;
[3]. Wallin S., et al. Laser-based Standoff Detection of Explosives: A Critical Review. Analytical and Bioanalytical Chemistry 395:259–274. 2009;
[4]. Ponsardin P. L., et al. Expanding Applications for Surfacecontaminant Sensing Using the Laser Interrogation of Surface Agents(LISA) Technique Proc. SPIE 5268, Chemical and Biological Standoff Detection. 2004.
[5]. Barton S. J., Ward T. E., Hennelly B. M.. Algorithm for Optimal Denoising of Raman Spectra. Analytical Methods 10:3759–3769. 2018;
[6]. Smulko J., Wrobel M. S., Barman I.. Noise in Biological Raman Spectroscopy 2015 International Conference on Noise and Fluctuations(ICNF). 2015.
[7]. Mosier-Boss P. A., Lieberman S. H., Newbery R.. Fluorescence Rejection in Raman Spectroscopy by Shifted-Spectra, Edge Detection, and FFT Filtering Techniques. Applied Spectroscopy 49(5):630–638. 1995;
[8]. Soberon-Celedon C. C., et al. Removal of Fluorescence and Shot Noises in Raman Spectra of Biological Samples Using Morphological and Moving Averages Filters. International Journal of Engineering and Technical Research 6(3):2454–4698. 2016;
[9]. Wang X., et al. Development of Weak Signal Recognition and an Extraction Algorithm for Raman Imaging. Analytic Chemistry 91(20):12909–12916. 2019;
[10]. Rasti B., Scheunders P., Ghamisi P., Licciardi G., Chanussot J.. Noise Reduction in Hyperspectral Imagery: Overview and Application. Remote Sensing 10(3):482. 2018;
[11]. Yu H.-G., Park J. H., Lee C. S., Park D.-J., Chang D. E., Nam H., Park B. H.. Performance Analysis of the Denoising Algorithms for Detection of Chemical Warfare Agents with Raman Spectroscopy KIMST Annual Conference Proceedings. 284–285. 2020.
[12]. Horgan C. C., et al. High-Throughput Molecular Imaging via Deep Learning Enabled Raman Spectroscopy arxiv:2009.13318. 2020.
[13]. Lu X., et al. Speech Enhancement based on Deep Denoising Autoencoder INTERSPEECH. 2013.
[14]. Schroff F., Kalenichenko D., Philbin J.. FaceNet: A Unified Embedding for Face Recognition and Clustering Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 815–823. 2015.
[15]. Loshchilov I., Hutter F.. SGDR: Stochastic Gradient Descent with Warm Restarts International Conference on Learning Representations. 2017.
[16]. Kingma D. P., Ba J.. Adam: A Method for Stochastic Optimization International Conference on Learning Representations(ICLR). 2015.
[17]. Manolakis D., Siracusa C., Shaw G.. Hyperspectral Subpixel Target Detection Using the Linear Mixing Model. IEEE Transactions on Geoscience and Remote Sensing 39(7):1392–1409. 2001;

Article information Continued

Fig. 1.

The structure of denoising autoencoder(DAE)

Fig. 2.

Loss curves of the proposed DAE over 1270 epochs of the trianing process. The solid black line is the training loss curve and the blue dotted line is the validation loss curve

Table 1.

Parameters of the denoising autoencoder

항목 파라미터
부호기 복호기
1층 2층 3층 1층 2층 3층
가중치 1024 × 1024 1024 × 512 512 × 128 128 × 512 512 × 1024 1024 × 1024
활성화함수 relu relu relu relu relu -

Table 2.

Parameter settings for noise reduction algorithms

알고리즘 파라미터
S-G filter 윈도우 크기 k = 5,
다항식 차수 n = 15
FT 저주파수 성분 개수 k = 256
MA 윈도우 크기 k = 5
MF 윈도우 크기 k = 3
DAE (C) 윈도우 크기 k = 3
DAE (CT) 윈도우 크기 k = 3

Fig. 3.

Visual comparison of GF spectra for the test cases (a) Raw GF spectrum, (b) S-G filter, (c) FT, (d) MA, (e) MF, (f) DAE (C), (g) DAE (CT)

Table 3.

Performances of the GLRT detector with the noise reduction methods for each background

배경 Raw S–G filter FT MA MF DAE (C) DAE (CT)
아스팔트 OA 0.82 0.84 0.84 0.85 0.84 0.88 0.89
콘크리트 OA 0.88 0.90 0.90 0.94 0.90 0.95 0.96
유리 OA 0.91 0.93 0.92 0.94 0.92 0.96 0.97

Fig. 4.

Comparison of test accuracies over different training dataset sizes