서 론
① 다양한 크기의 표적 : 표적 탐지 수행 시에 서로 다른 크기를 가진 표적이 SAR 영상 내에 존재하는 경우를 의미한다. MSTAR Public SAR 표적 대비 0.6배에서 1.5배의 다양한 크기로 표적의 크기를 변경하여 데이터 셋을 구성한다. 이는 표적을 서로 다른 GSD(Ground Sample Distance)에서 획득한 영상의 경우로 볼 수 있으며, 이러한 조건에서도 표적 탐지를 수행할 수 있는지 검증한다.
② 다양한 표적 밀집 상황 : 여러 종류의 SAR 표적들이 좁은 간격으로 밀집해 있는 경우를 의미한다. 각 표적의 간격은 평균적으로 표적의 크기보다 작으며 서로 다른 표적의 영역이 겹치지 않으면서 최대한 가까이 존재하는 밀집 상황도 존재한다.
③ 고(高)클러터 환경 : 본 논문에서 사용한 표적 탐지 데이터 셋은 기존 SAR 표적 탐지 알고리즘에서 사용하는 해상, 평야 등의 고른 클러터 환경과는 달리 도심지 고층 빌딩, 숲 등이 존재하는 고(高)클러터 환경에서 획득된 SAR 영상을 기본으로 한다.
④ 건물과 표적 밀착 상황 : 도심지 고(高)클러터 환경에 해당하는 SAR 영상의 경우 표적과 표적 사이의 간격뿐만 아니라 표적과 고(高)클러터 영역에 해당하는 건물과의 간격도 작게 설정한다. 이 경우 건물에 해당하는 영역에 대해서 쉽게 오탐지(False Positive)가 발생할 수 있다.
관련 연구
2.1 딥러닝 기반 표적 탐지 알고리즘
2.2 어텐션 알고리즘
Attention YOLOv4 기반 표적 탐지 알고리즘
3.1 기존 YOLOv4[14] 네트워크 구조
3.1.1 백본 네트워크
3.1.2 넥 네트워크
3.1.3 헤드 네트워크
3.2 어텐션 모듈을 적용한 YOLOv4[14] 백본 네트워크 구조의 확장
3.2.1 Cascade Channel-Spatial Connection
3.2.2 Parallel Channel-Spatial Connection
3.2.3 Coordinate Attention[10]
MSTAR SAR embedding datasets
4.1 MSTAR Public Datasets[15]
Table 1.
Parameters | Value |
---|---|
Depression angle (°) | 15 |
Height of image (pixels) | 1784 |
Width of image (pixels) | 1472 ~ 1478 |
Mode | Strip map |
The number of scenes | 87 |
Range resolution (m) | 0.3 |
Range Pixel Spacing (m) | 0.2 |
4.2 Target Embedding
4.2.1 클러터 신호 비율 조정
4.2.2 표적 합성을 위한 마스크 생성
4.2.3 표적 합성 방법
4.2.4 표적 신호 미약 시나리오 테스트 데이터 셋
4.3 Training/Test datasets
4.3.1 Training datasets
4.3.2 Test datasets
실험 결과
5.1 Training/Test Parameters
• 학습 반복 횟수(Training step) : 1,400,000
• 학습에 사용한 배치(서브 배치) 크기 : 64(4)
• Learning rate : 0.001(1,250,000 step 후 0.0002)
• Adam optimizer(beta1 : 0.9, beta2 : 0.999)
• 신뢰도 문턱값(confidence threshold) : 0.6
• NMS(Non Maximum Suppression) threshold : 0.6
① Localization loss : 각 바운딩 박스의 위치 좌표에 대한 Binary Cross Entropy loss 및 가로 세로 길이에 대한 MSE loss
② Classification loss : 표적의 종류(Class)에 대한 Binary Cross Entropy loss
③ Confidence loss : 탐지 결과의 신뢰도 점수(Confidence score)에 대한 Binary Entropy loss
5.2 표적 탐지 알고리즘 성능 비교
5.2.1 YOLOv4 기반 알고리즘별 표적 탐지 성능 비교
Table 6.
5.2.2 표적 신호 미약 상황에서의 YOLOv4 기반 알고리즘별 표적 탐지 성능 비교
Table 7.
결 론
① ① 트랜스포머(Transformer) 기반 백본 네트워크 : 현재 활발히 연구되고 있는 주제인 자기-어텐션(self- attention) 기법을 활용한 트랜스포머 구조를 백본 네트워크에 적용하여 동일한 열악한 표적 탐지 상황에서 성능이 향상될 수 있음을 보인다. 다만, 트랜스포머 구조를 백본 네트워크에 추가하면 본 논문에서 채택한 어텐션 모듈보다 계산 복잡도가 상당히 증가하기 때문에, 추론 속도와 성능을 모두 고려하는 측면에서 해당 구조에 대한 효과적인 활용 방안을 모색하고자 한다.
② 손실 함수를 위한 탐지 바운딩 박스 보완 : 현재 학습 및 테스트에 사용되는 탐지 바운딩 박스는 꼭짓점의 위치 및 길이 정보만 포함하고 있으므로 다양한 방위방향을 가지는 표적의 정확한 위치를 나타내기 어렵다. 이를 해결하기 위해 바운딩 박스에 각도 정보를 포함해서 표적의 방위방향에 따라서 더욱 정밀하게 표적의 위치를 나타낼 수 있도록 보완한다면 손실함수 계산 및 IoU 계산 측면에서 높은 신뢰도를 확보할 수 있다.