Ⅰ. 서 론
수중 음향 환경은 날씨, 조류, 수온, 계절 변화 등으로 인해 매우 동적이고 예측이 어렵기 때문에 정밀한 감지와 분석이 어렵다[1]. 특히 실시간 감지 시스템에서는 기존에 학습되지 않은 새로운 음향 신호가 출현할 가능성이 높고, 이는 위협 요소나 이상 상황을 나타낼 수 있다. 이러한 환경에서 널리 사용되는 수동 소나 시스템은 하이드로폰을 통해 음향을 수집하며, 자체 신호를 방사하지 않아 보안성이 높다는 장점이 있다. 이와 같은 수동 소나 데이터를 기반으로 다양한 표적 인식 기법이 제안되어 왔으며, 최근에는 CNN 및 트랜스 포머 기반의 딥러닝 모델이 높은 성능을 보여주고 있다[2,3].
그러나 위 연구는 학습된 클래스만을 대상으로 하며, 학습되지 않은 새로운 신호가 입력되었을 때 기존 클래스 중 하나로 잘못 분류하는 문제가 있다. 이를 해결하기 위해 이상 탐지 기법(novelty detection)에 대한 연구가 진행되고 있으며, 계층적 LSTM 오토인코더나 stacked autoencoder를 활용한 방법이 제안되었다[4,5]. 하지만 클래스 수증가에 따른 복잡도 증가, 임계값 설정의 민감도 등 여러 한계를 지닌다. 또 다른 방법으로는 MSP(Maximum Softmax Probabilities) 기법이 있으나, 이는 과신(over-confidence) 문제로 인해 분포 외 데이터를 정확히 탐지하는 데 한계가 있다[6].
본 연구에서는 이러한 한계를 극복하기 위해 ODIN(Out-of-DIstribution Detector for Neural Networks) 기법을 수중 음향 환경에 적용한 이상 탐지 방법을 제안한다. ODIN은 추론 시 소프트맥스 출력에 온도 스케일링을 적용하고, 입력에 미세한 교란을 추가하여 분포 내/외 샘플 간의 출력 차이를 유도한다[7]. 이후 소프트맥스 최대 출력값에 임계값을 적용함으로써 이상 신호를 효과적으로 탐지할 수 있으며, 이를 통해 수중 환경에서의 미지 신호에 대한 탐지 성능을 향상시키고자 한다.
Ⅱ. ODIN 기반 이상 음원 탐지
본 연구에서는 수중 음향 환경에서 학습에 포함되지 않은 신호를 효과적으로 탐지하기 위해 ODIN 기반의 이상 음원 탐지 프레임워크를 제안한다. 제안하는 방법은 그림 1의 (1) Attention ResNet(AResNet) 분류 모델을 학습하는 과정과[8], (2) 온도 스케일링과 입력 교란을 포함하는 ODIN 기법을 통해 얻은 보정된 소프트맥스 출력값 중 최대값을 이상 점수로 사용하여 이상 여부를 판단하는 추론 과정으로 구성된다. 이상 점수가 설정된 임계값 이상이면 입력 신호는 학습된 클래스 중 하나로 간주되며, 분류기의 예측 결과를 따른다. 반대로 이상 점수가 임계값 미만이면 입력은 이상 음원으로 탐지된다.
제안하는 ODIN 기반 이상 탐지 방법의 개요도(Scheme of the proposed ODIN based novelty detection method)
추론 과정에서 사용되는 온도 스케일링 계수 T와 입력 교란 크기 은 각각 [TeX:] $$\mathrm{T}=\left\{1,2,5,10,50,100,500\right\}, \epsilon=\left\{0,10^{-7}, 10^{-6}, 10^{-5}, 10^{-4}, 10^{-3}, 10^{-2}\right\}$$의 값에 대해 실험을 수행하였다.
Ⅲ. 실험 결과 및 분석
본 논문의 검증을 위해 4종류로 분류된 선박 운행시의 소음 데이터를 포함하는 DeepShip 공개 데이터셋을 사용하였다[9]. 학습/검증/테스트를 7/2/1 비율로 나누었으며, mel-frequency cepstral coefficient(MFCC)를 입력 피쳐로 사용하였다.
이상 탐지 모델의 성능 평가를 위해 AUROC, FPR@95TPR, AUPR-In, AUPR-Out을 사용하였다. AUROC는 이상 점수를 기준으로 다양한 임계값에서 의 TPR(True Positive Rate)과 FPR(False Positive Rate)을 계산해 ROC 곡선 아래 면적을 측정한 값으로, 전반적인 분류 성능을 나타낸다. FPR@95TPR은 TPR이 95%일 때의 FPR 값을 의미하며, 미지 클래스를 학습된 클래스와 혼동하는 비율을 나타낸다. AUPR-In과 AUPR-Out은 각각 학습된 클래스와 미지 클래스를 양성으로 간주하여 계산한 precision-recall 곡선의 면적으로, 정상 및 이상 클래스에 대한 탐지 성능을 정량화한 지표이다.
표 1은 제안한 ODIN과 MSP의 이상 탐지 성능을 각 클래스에 대해 각각 미지 클래스로 설정하여 비교한 결과이다. FPR@95TPR이 가장 낮았던 T = 10, 10-5에서, ODIN은 모든 지표에 대해 클래스별 샘플 수를 고려한 평균 성능값이 MSP 대비 우수한 결과를 보였다. 특히 AUPR-in의 성능저하 없이 AUPR-Out에서 2.75%의 성능 향상이 나타나, 제안한 방법이 정상 클래스 분류 성능을 유지하면서도 미지 클래스 탐지 능력을 효과적으로 향상시켰음을 알 수 있다.
이상 신호 탐지 성능 비교(MSP/ODIN)(Novelty detection performance(MSP/ODIN))
Ⅳ. 결 론
본 연구에서는 수중 음향 환경에서 학습되지 않은 미지의 음향 신호를 효과적으로 탐지하기 위해 ODIN 기반의 이상 음원 탐지 프레임워크를 제안하였다.제안한 방법이 모든 지표에서 기존 방법 대비 우수한 성능을 나타내었다. 이러한 성능 향상은 온도 스케일링을 통해 소프트맥스 출력의 과신을 완화하고, 입력 교란을 통해 분포 내/외 샘플 간의 출력 차이가 효과적으로 보정된 결과로 볼 수 있다. 이는 제안한 방법이 정상 클래스의 분류 성능을 유지하면서도 미지의 수중 음향 신호를 보다 안정적으로 탐지할 수 있는 가능성을 보여주며, 제안한 방법의 실용성과 적용 가능성을 입증하였다.