Introduction
① 단일 채널 중적외선 데이터셋에 더 적합하게 원래 U-Net 아키텍처를 수정했다.
② 전투 시나리오에서 적외선 데이터 개선을 위해 적대적 네트워크 사용을 조사하였다. 이는 본 연구의 조사범위 내에서는 최초로 시도된 접근법이다.
③ 합성, 개선된, 실제 적외선 이미지의 주파수 및 전력 스펙트럼을 분석하여 이미지 개선의 품질을 평가할 수 있는 Human-in-loop 평가 방법을 고안했다.
④ 설명 가능한 인공지능(XAI) 모델을 사용하여 제시된 네트워크를 설명하고, 개선된 적외선 이미지와 합성 적외선 이미지간의 차이를 설명한다.
Image Refinement
2.1 U-Net Refiner
2.2 Markovian Discriminator
2.3 Loss Function
Network Explanation
Results and Discussions
① 구글지도 및 이에 대응되는 위성촬영 이미지.
② DSIAC SENSIAC ATR 데이터셋: 미 국방 시스템 정보 분석 센터(DSIAC) 야시센서부서(NVESD)에서 자동 표적 인식(ATR) 개발을 위해 제공하는 다양한 전장 시나리오와 군용 차량 유형에 대한 실제 적외선 이미지.
③ OKTAL-SE 데이터셋: SENSIAC ATR 데이터셋의 전장시나리오 파라미터를 반영, OKTAL-SE 시뮬레이터로 생성된 OKTAL-SE 합성 적외선 이미지로서 목표물로부터의 거리, 목표물의 유형, 날씨 조건(흐림, 맑음, 비), 계절(여름, 가을 등), 하루 중 시간, 목표물의 시야각 등을 제어할 수 있다. 따라서, OKTAL-SE 데이터는 DSIAC SENSIAC ATR 데이터셋과 약결합 되어있다(단, 픽셀 대 픽셀로 정확히 일치하지는 않다).
④ 실제 야외 촬영 데이터셋: 드론(DJI Matice 300 ATK) 탑재 MWIR 카메라로 촬영한 야외환경 적외선 이미지(Table 1).
Table 1.
Attribute | Camera Specifications |
---|---|
Camera Model | DJI ZENMUSE H20T |
Sensor | Vanadium Oxide microwave bolometer |
Lens: DFOV | 40.6 deg |
Lens: FocalLength | 13.5 mm |
Lens: Aperture | f/1.0 |
Lens: Focus | 5 m to ∞ |
4.1 Training Approaches
① 접근법 A(지도 → 위성 이미지): 구글 지도에서 스크랩한 지도-위성 이미지 세트. 각 지도와 위성 이미지는 픽셀 단위에서 대응되며, 네트워크는 입력된 지도 이미지를 요구되는 출력(위성 이미지)와 비교하며 출력 이미지를 개선하도록 학습됨.
② 접근법 B(OKTAL → SENSIAC): OKTAL 데이터셋(합성 적외선 이미지) 입력을 통해 생성된 출력을 SENSIAC 데이터셋과 비교. OKTAL 데이터셋은 SENSIAC 데이터셋의 시나리오(촬영환경)를 반영하여 제작되었으나, 이미지 간의 픽셀 단위 대응은 없음.
③ 접근법 C(합성 이미지 patch가 포함된 SENSIAC → SENSIAC): OKTAL 데이터셋의 이미지 patch를 포함하도록 편집된 SENSIAC 이미지를 입력하여, 생성된 출력결과를 SENSIAC 이미지(실제 적외선 이미지)와 비교. 두 데이터셋은 부분적으로 픽셀 단위 대응됨.
④ 접근법 D(부분적으로 낮은 양자화 수준을 적용한 SENSIAC → SENSIAC): SENSAC 이미지에서 일부 patch의 양자화 수준을 원본(256)보다 낮은 수준(16)으로 감소시킨 이미지를 입력으로, 원본 SENSIAC 이미지를 비교대상으로 사용. 두 데이터셋은 픽셀 단위로 대응됨.
⑤ 접근법 E(낮은 양자화 수준을 적용한 실제 적외선 이미지 → 실제 적외선 이미지): 실제 적외선(SENSIAC 및 야외촬영 데이터셋) 이미지의 양자화 수준을 감소시킨 이미지(256 → 16)를 입력으로, 원본 실제 적외선 이미지를 비교 대상으로 사용. 두 데이터셋은 픽셀 단위로 대응됨.
4.2 Evaluation Criterion
① 실제 적외선 이미지의 공간 주파수 스펙트럼(Fig. 5(c))은 픽셀 값의 균일한 분포로 인해 가로-세로 축 영역 대부분에서 대칭적이다. 합성 이미지의 스펙트럼은 이러한 대칭성이 거의 관찰되지 않는다.
② 합성 이미지의 주파수 스펙트럼(Fig. 5(b))은 픽셀 데이터의 제한된 양자화 수준 때문에 반점과 같은 반복 패턴이 형성된다.
③ 합성 적외선 이미지의 파워 스펙트럼(Fig. 5(d))은 주파수 전 영역에 걸쳐 급격한 변화를 보인다. 반면 실제 적외선 이미지의 파워 스펙트럼의 변화율은 상대적으로 안정되어있으며, 낮은 주파수에서 높은 크기에서 높은 주파수로 이동할수록 감소하는 경향을 보인다.
④ 본 연구에서 활용한 데이터셋의 실제 적외선 이미지 파워 스펙트럼은 저주파수 범위에서 고주파수 범위까지 선형적인 특성을 보이는데, 이러한 선형성을 정량화하기 위해 피어슨 상관계수(PPMCC 또는 PCC)를 사용하였다. 계수의 범위는 −1∼1이며, 파워 스펙트럼이 선형 관계를 보일 때 PPMCC의 절대값은 1에 가까워진다.
⑤ 추가로, 개선된 이미지가 고급 분류 네트워크에 일반화될 수 있는지 확인하였다. ResNet-50 분류 네트워크에 XAI 기법을 적용하여 군용 차량 카테고리에 대한 클래스 활성화 맵(CAMs)을 생성하였다. CAM을 사용하여 개선된 이미지의 영역을 강조하고, XAI를 통해 타겟 분류에 대한 신뢰도 점수를 생성하였다. 본 신뢰도 점수를 통해 실제 적외선 이미지와 비교하여 개선 정도를 평가하였다.