IndexFiguresTables |
Sunghwan Cho♦, Haejoon Jung*, YongchulKim°, Myungsik Lee**, Yohan Kim**Deep Learning-Based Modulation Classification of LPI Radar Signals Using Multi-Antenna Diversity IntegrationAbstract: This paper proposes a deep learning-based modulation classification system designed to effectively detect and classify Low Probability of Intercept (LPI) radar signals in Electronic Warfare (EW) environments. While previous studies primarily focused on signals captured from a single antenna, practical battlefield environments typically involve multiple antennas spatially distributed to simultaneously intercept incoming signals. Therefore, this study emphasizes the utilization of diversity gain achieved through integrating signals from multiple antennas. To this end, we propose a method that employs various backbone networks, such as CNN, EfficientNet-B2, and ResNet-50, to extract feature vectors from each antenna signal, followed by feature integration using methods including LSTM, concatenation, and average pooling. Experimental results integration using methods including LSTM, concatenation, and average pooling. Experimental results demonstrate that, under challenging low-SNR conditions (specifically, at an SNR of -10 dB), the classification accuracy significantly improves from approximately 65% with a single CNN-based channel to 87.6% with the proposed CNN-LSTM-based five-channel diversity system. Thus, our research empirically verifies that the proposed multi-antenna integration method notably outperforms the conventional single-antenna approach. Keywords: LPI Radar , Modulation Classification , Diversity Gain , Deep Learning , Electronic Warfare 조성환♦, 정해준*, 김용철°, 이명식**, 김요한**다중 안테나 다이버시티 통합을 이용한 딥러닝 기반 저피탐 레이다 신호 변조 분류 연구요 약: 본 논문은 전자전 환경에서 저피탐(Low Probability of Intercept, LPI) 레이다 신호의 변조 방식을 효과적으로탐지 및 분류하기 위한 다중 안테나 다이버시티 통합 기반의 딥러닝 분류 시스템을 제안한다. 기존의 연구들은 주로 인터셉트한 단일 신호만을 대상으로 하였으나, 실제 전장 환경에서는 다수의 안테나를 공간적으로 분산 배치하여 신호를 동시에 수신하는 구조가 일반적이다. 따라서 본 연구는 다중 안테나 수신 환경에서 신호 통합을 통한다이버시티 이득(diversity gain)의 활용을 주요 목적으로 한다. 이를 위해 CNN, EfficientNet-B2, ResNet-50 등다양한 백본 네트워크를 사용하여 각 안테나 신호로부터 특징 벡터를 추출하고, 추출된 특징들을 LSTM, Concatenation, Average Pooling과 같은 여러 통합 기법을 통해 결합하는 방식을 제안한다. 실험적으로 SNR이 – 10dB인 열악한 환경에서 단일 CNN의 분류 정확도가 약 65%에 그친 반면, 제안한 CNN-LSTM 기반의 5채널 다이버시티 시스템에서는 정확도가 87.6%까지 크게 상승하였다. 본 연구를 통해 다중 안테나 기반 통합 방식이 단일 안테나 대비 현저히 우수한 성능을 나타냄을 실험적으로 입증하였다. 키워드: 저피탐 레이다, 신호 변조 분류, 다이버시티 이득, 딥러닝, 전자전 Ⅰ. 서 론전자전(Electronic Warfare, EW)은 군사적 목적으로 전자기 스펙트럼을 활용하는 작전으로서, 일반적으로 전자공격(Electronic Attack, EA), 전자보호(Electronic Protection, EP), 전자전 지원(Electronic Support, ES)으로 분류된다[1]. 그중 ES는 적의 통신이나 레이다 시스템 등에서 방사되는 전자기 신호를 수신 및 분석하여, 적의 위치를 특정하거나 신호의 세부특성을 식별하여 효과적인 대응 수단을 제공하는 역할을 수행한다. 이러한 ES의 능력에 대응하기 위해, 탐지 확률을 최소화하는 저피탐(Low Probability of Intercept, LPI) 레이다가 사용되고 있다. LPI 레이다는 펄스 압축(Pulse Compression) 기술을 적용하여 레이다 신호의 최대 피크 전력을 낮추면서도 목표물 탐지에 요구되는 충분한 분해능을 확보할 수 있는 특성을 갖는다[2]. 최대 피크 전력이 낮으므로 적 ES 장비에 의한 탐지 확률을 낮출 수 있다. 이를 실현하기 위해 레이다 시스템은 펄스의 주파수나 위상을 정교하게 변조하여 신호의 대역폭을 증가시키는 방식을 채택하고 있으며, LPI 레이다의 성능과 목적에 따라 다양한 변조 기법이 사용되고있다. 반대로, 만약 ES 시스템이 수신한 레이다 신호의 변조 방식을 정확히 인식할 수 있다면, 해당 레이다시스템의 특성이나 성능을 역으로 추정하는 데 결정적인 정보를 얻을 수 있게 된다. 이처럼 LPI 신호의 정확한 탐지와 변조 방식 식별 능력의 향상은 현대 전자전 환경에서 ES 작전의 효과를 극대화하기 위한 필수적인 요소로 여겨진다[3]. 또한, 전자공격에서 수행되는 재밍(jamming) 작전을 효과적으로 수행하기 위해서는 목표 레이다 시스템이 사용하는 신호의 특성에 대한 정확한 정보가 필수적이다. 특히 미래전장의 핵심 요소로 부상하고 있는 우주 기반 자산에 대한 재밍을 효과적으로 수행하기 위해서는 신호 정보의 정확한 수집과 분석이 더욱 중요해지고 있다. 위성 상향 링크(uplink)의 경우 지상에서 위성으로 향하는 빔 폭이 매우 좁아 신호 세기가 극히 약하며, 그 빔 내에 신호 수집 장비를 정밀하게 배치하는 것이 기술적으로 매우 어렵다. 이에 따라 지상뿐만 아니라 공중 플랫폼 및 우주 공간에서 운용되는 신호 감지 위성 등 다양한 자산을 통해 동시다발적으로 수집된 신호 정보를 효과적으로 통합하고 분석하여 신호 탐지 및 변조 방식 식별의 정확성을 높이는 것이 더욱 중요한 과제가 되고 있다. 이러한 배경으로 인해 LPI 레이다 신호의 탐지 및 변조 방식 식별에 관한 연구가 활발히 수행되어 왔다. 최근 연구에서는 수신된 신호의 시간 도메인 데이터를 시간-주파수 이미지(Time-Frequency Image, TFI)로 변환한 후, 이를 이미지 분류 모델에 적용하여 변조 방식을 분석하려는 시도들이 보고된 바 있다[4-8]. 그러나 기존의 연구들은 대부분 수신된 개별 신호에 초점을 맞추어 신호 탐지 및 분류 성능을 평가하였다. 실제 전장 환경에서 운용되는 레이다 인터셉터 시스템은 그림 1과 같이 여러 개의 Remote Antenna Probe를 공간적으로 분산 배치하여, 동시에 다양한 위치에서 LPI 신호를 수신하는 다중 안테나 구조를 갖는다[9]. 이러한 구조는 서로 다른 경로 손실, 페이딩 및 잡음 조건에서 수신된 신호들을 효과적으로 결합함으로써, 단일 안테나 대비 더욱 강인한 신호 분류 성능을 제공할 수 있다. 즉, 다중 안테나 구조를 활용한 다이버시티 이득(diversity gain)은 신호가 약하거나 잡음이 많은 극한 환경에서 ES 시스템의 신호 분류 정확도를 향상시키는 데 필수적이다. 그러나 다중 안테나로부터 획득된 신호는 시간 동기화 오차 및 각기 상이한 전파 경로 특성 등으로 인해 기존 수학적인 접근 방식을 통해 신호들을 결합하는 것이 어려운 실정이다. 따라서 각 안테나에서 수신된 신호로부터 효과적으로 변조 정보를 추출하고, 이를 최적의 방식으로 통합할 수 있는 기술이 필수적으로 요구된다. 본 논문에서는 실제 레이다 인터셉터 시스템을 모사하여, 그림 1과 같은 다중 안테나 구조에서 수신된 LPI 신호에 대해 CNN, EfficientNet-B2, ResNet-50 등과 같은 다양한 딥러닝 기반의 백본 네트워크를 적용하고, 각 안테나에서 추출한 특징 벡터들을 LSTM, Concatenation, Average Pooling과 같은 다양한 통합 기법을 통해 결합하는 다이버시티 기반의 LPI 신호 변조 분류 시스템을 제안한다. 이를 통해 다중 안테나 환경에서의 신호 통합 방법 및 변조 분류 성능을 체계적으로 분석하고, 백본 네트워크의 선택과 통합 방식이 전체 시스템의 성능에 미치는 영향을 분석하고자 한다. 본 논문의 구성은 다음과 같다. 2장에서는 다중 안테나 환경에서의 신호 모델, 시간-주파수 이미지 생성 방법 및 데이터셋 구성 방법을 제시한다. 3장에서는 제안 시스템의 구조를 상세히 설명하고, 백본 네트워크와 각 통합 기법에 대한 세부 사항을 다룬다. 4장에서는 다양한 조건에서 실시된 실험 결과를 제시하고, 이를 종합적으로 분석하여 본 논문에서 제안하는 시스템의 성능과 유효성을 입증한다. Ⅱ. 시스템 모델2.1 Rician 채널에서의 LPI 신호레이다 인터셉터(interceptor)에 설치된 서로 다른 안테나 [TeX:] $$k \in\{1,2, \cdots, N\},$$에 수신되는 LPI 레이다 신호는 식 (1)과 같이 표현된다
(1)[TeX:] $$y_k(t)=h_k(t)\left[A \exp \left\{j\left(2 \pi f_c t+\phi(t)\right)\right\}\right]+n_k(t)$$여기서 [TeX:] $$h_k(t)$$는 안테나 k에 대한 채널 계수(coefficient)를 의미하고, [TeX:] $$n_k(t)$$은 안테나 k에 해당하는 가우시안 잡음잡음(Additive White Gaussian Nosie, AWGN)을 의미한다. 또한 [TeX:] $$f_c$$는 반송파 주파수, [TeX:] $$\phi(t)$$는 시간에 따른 위상 변화를 나타내며, 이 두 요소는 신호의 변조 방식을 결정한다. LPI 신호의 변조 기법은 크게 두 가지로 구분할 수 있다. 첫째, 위상 성분 [TeX:] $$\phi(t)$$가 일정하고 시간에 따라 반송 주파수 [TeX:] $$f_c$$가 변하는 경우, 이는 주파수 변조 방식으로 LFM(Linear Frequency Modulation)이나 Costas 코드 등이 이에 해당한다. 둘째, 반대로 [TeX:] $$f_c$$가 고정되어 있고 [TeX:] $$\phi(t)$$가 시간에 따라 변하는 경우, 이는 위상 변조 방식으로 BPSK(Binary Phase Shift Keying), Frank 등 다양한 방식이 존재한다. 본 연구에서는 LPI 레이다 시스템에서 자주 활용되는 BPSK, Costas, Frank, LFM, P1-P4, T1-T4 등 총 12가지 변조 기법을 고려하였다[7]. 레이더에서 방사된 신호가 인터셉터의 안테나에 수신될 때, 각기 다른 안테나에서 수신되는 신호는 일반적으로 강한 직선 경로(Line of Sight, LoS) 성분을 포함하며, 주변 환경에 의한 다중 반사로 인해 복수의 경로가 형성된다. 이러한 특성으로 인해 수신 채널은 Rician 채널 모델을 통해 효과적으로 표현할 수 있다. 예를 들어, 전투기 기체에 여러 개의 안테나가 분산 배치되어 있는 경우, 레이다 소스와의 직접 경로 뿐만 아니라 기체 표면 등에서 발생하는 반사 및 산란 효과로 인해 비직선 경로(Non-Line of Sight, NLoS) 성분도 함께 존재하게 된다. Rician 채널 모델을 활용하면 식 (1)의 채널 계수 [TeX:] $$h_k(t)$$는 아래와 같이 표현될 수 있다.
(2)[TeX:] $$\begin{aligned} h_k(t)= & \sqrt{\frac{K_k}{K_k+1}} h_{\mathrm{LoS}}(t) \\ & +\sqrt{\frac{1}{K_k+1}} h_{k, \mathrm{NLOS}}(t) \end{aligned}$$여기서 [TeX:] $$K_k$$는 안테나 k의 Rician K-계수로, 이는 직선 경로와 비직선 경로의 전력비를 의미한다. 또한, [TeX:] $$h_{\mathrm{LoS}}(t)=\alpha_{\mathrm{LoS}} \exp j \theta_{\mathrm{LoS}}$$는 고정 진폭([TeX:] $$\alpha_{\mathrm{LoS}}$$) 및 위상([TeX:] $$\theta_{\mathrm{LoS}}$$)으로 구성된 직선 경로 성분을, [TeX:] $$h_{k, \mathrm{NLoS}}(t)$$은 다중경로 성분을 의미한다. 본 논문에서는 [TeX:] $$\alpha_{\mathrm{LoS}}=1, \quad \theta_{\mathrm{LoS}} \sim \operatorname{Uniform}(0,2 \pi),$$ [TeX:] $$h_{k, \mathrm{NLoS}}(t) \sim C N(0,1)$$으로 가정하였으며, 레이다와 인터셉터 간의 채널을 직선 경로 성분이 우세한 지상-공중 또는 공중-공중 링크로 가정하여 [TeX:] $$K_k=10$$으로 설정하였다[10,11]. 2.2 신호의 시간-주파수 분석LPI 신호를 시간-주파수 이미지로 변환하기 위한 다양한 시간-주파수 해석(Time-Freqeuncy Analysis, TFA) 기법들이 존재하며, 대표적으로 CWD(Choi–Williams Distribution), WVD(Wigner–Ville Distribution), STFT(Short-Time Fourier Transform) 등이 있다. 본 연구에서는 TFA 과정에서 발생하는 교차항(Cross-term) 성분을 효과적으로 억제하면서도 신호의 특성을 잘 보존할 수 있는 CWD 기법을 채택하였다[2]. 안테나 k에서 수신된 LPI 레이다 신호 [TeX:] $$y_k(t)$$의 CWD 기반의 시간-주파수 변환은 다음과 같은 수식으로 표현된다.
(3)[TeX:] $$\begin{aligned} & C W D_k(t, \omega)=\int_{\tau=-\infty}^{\infty} e^{-j \omega \tau} \int_{\mu=-\infty}^{\infty} \sqrt{\frac{\sigma}{4 \pi \tau^2}} \\ & e^{-\sigma(\mu-t)^2 /\left(4 \tau^2\right)} y_k\left(\mu+\frac{\tau}{2}\right) y_k\left(\mu-\frac{\tau}{2}\right) d \mu \mathrm{~d} \tau \end{aligned}$$여기서 [TeX:] $$t, \omega(=2 \pi f), \sigma$$는 각각 시간, 각주파수, 스케일링 파라미터 변수를 가리킨다. 2.3 데이터셋 구성실제 레이다 인터셉션 상황에서의 LPI 신호 수신을 모사하기 위해, 신호 생성 과정에서 신호 길이, 중심 주파수, 대역폭 등의 주요 파라미터를 표 1과 같이 임의로 설정하였다. 이는 실제 전자전 환경에서 ES 장비가 신호를 수집하고 분석할 때, 신호의 사전 정보가 매우 제한적인 상황을 모사하기 위함이다. 생성된 신호는 SNR 수준을 –10 dB부터 10 dB까지 변화시키며 다양한 조건에서의 수신 환경을 반영하였고, 이에 따라 AWGN 잡음을 추가하여 현실적인 잡음 환경을 구현하였다. 표(Table) 1. LPI 신호의 파라미터 (Parameters of Signals, adopted from [ 4])
신호의 시점 조정은 [12]에서 제안된 기법을 참고하여, 신호가 불규칙하게 발생하는 상황을 모사하였다. 이는 실제 전장 환경에서 LPI 신호가 시간과 위치에 관계없이 불규칙하게 발생할 수 있다는 점을 반영한 것으로, 탐지 및 식별에 불리한 조건을 조성한다. 수신된 LPI 신호 [TeX:] $$y_k(t)$$가 대응하는 레이다로부터 송신된 신호의 원래 길이를 T라고 할 때, 인터셉터는 길이 [TeX:] $$T_c \in[0.7 T, 1.3 T]$$의 무작위한 길이의 윈도우를 사용하여 포착하였다고 가정하였다. 이때 T의 값은 LPI 레이다 시스템이 사용하는 변조 기법과 파라미터에 따라 상이하게 결정되며, 이를 레이다 인터셉터는 해당 정보를 사전에 알 수 없다는 점에서 무작위성이 부여되었다. 또한, 획득 윈도우의 시작 지점 [TeX:] $$T_{\mathrm{sp}}$$는 실제 LPI 신호 [TeX:] $$y_k(t)$$의 수신 지점으로부터 [0.5 T, 0.5 T] 사이에 위치한다고 가정하여, 무작위한 시점에서 수신되는 데이터를 생성하였다. 그림 2는 다양한 변조 방식을 적용해 생성한 LPI 신호를 CWD 기법으로 변환한 시간 주파수 이미지를 보여주고 있다. 신호 성분의 시작점과 끝점이 무작위한 위치에 나타나며, 일부 신호의 경우 전체 신호 성분이 아닌 일부분만 나타나는 것을 확인할 수 있다. Ⅲ. 다이버시티 기반의 LPI 신호 변조 분류 시스템본 논문에서 제안하는 시스템은 그림 3에서 볼 수 있듯이 백본 네트워크(backbone network)와 통합 계층(integration layer)의 두 단계로 구성된다. 첫 번째 단계인 백본 네트워크는 CNN, ResNet, EfficientNet 등의 다양한 딥러닝 알고리즘을 활용하여 레이다 인터셉터의 다중 안테나로부터 수신된 신호의 CWD 기반 시간-주파수 이미지로부터 특징을 추출한다. CNN 기반 네트워크는 이미지 특징 추출에 탁월한 성능을 보이며, 특히 ResNet과 EfficientNet은 각각의 깊이와 복잡도에 따른 네트워크 구조의 차이를 통해 더욱 세밀한 특징 추출이 가능하다. 이렇게 생성된 특징 벡터들은 두번째 단계인 통합 계층으로 전달된다. 통합 계층에서는 장단기 메모리 네트워크(LSTM), 평균 풀링(average pooling), 연결(concatenation) 등의 방법을 통해 추출된 특징 벡터를 결합한다. LSTM은 입력된 여러 특징 벡터 간의 시간적 또는 순차적 상관관계를 학습하여 데이터 간의 관계성을 효과적으로 반영할 수 있으며, 평균 풀링은 특징 벡터의 모든 원소 평균을 통해 통합 데이터의 전역적(global) 특성을 간결하게 요약하여 잡음 및 이상값의 영향을 최소화하는 데 유리하다. 연결은 모든 특징 벡터의 정보를 손실 없이 유지하여 보다 세밀한 특징 통합을 가능하게 한다. 이번 장에서는 이미지 특징 추출을 위한백본 네트워크에 대한 설명과, 추출된 특징을 결합하기 위한 방안에 대해 구체적으로 설명한다. 3.1 백본 네트워크백본 네트워크는 시간 주파수 이미지를 입력으로 하여 이미지의 특징을 추출하는 역할을 수행한다. 본 논문은 다수의 입력 이미지를 개별 네트워크로 처리하는 대신 TimeDistributed 레이어로 백본 네트워크를 래핑(wrapping)하여 모든 입력 이미지에 동일한 백본 딥러닝 머신러닝 알고리즘을 적용한다[13]. 이를 통해 각 이미지로부터 얻어진 특징 벡터들을 시계열 형태의 벡터 시퀀스 [TeX:] $$Z=\left[z_1, z_2, \cdots, z_N\right]$$으로 출력하며, 파라미터를 공유함으로써 이미지 개수 증가에 따른 복잡도 증가를 억제하고 효율적인 특징 추출이 가능하다. 즉, TimeDistributed 레이어를 사용하지 않고 각 입력별로 별도의 머신러닝 네트워크를 적용하면 파라미터 수가 선형적으로 증가하여 비효율적이지만, 본 구조에서는 학습된 하나의 백본 모델을 통해 모든 이미지를 처리하므로 중복 가중치 없이 다중 이미지의 특징을 추출할 수 있다. 본 논문에서는 백본 네트워크로 CNN[5], ResNet 잔차 네트워크[14], 그리고 EfficientNet[15]등 세가지 모델을 고려하였다. 합성곱 신경망(Convolutiona Neural Network, CNN)은 최근 이미지 분류 분야에서 뛰어난 성과를 보이고 있으며, 크게 입력층, 은닉층, 출력층으로 이뤄진 피드-포워드(feed-forward) 네트워크로서, 일반적으로 은닉층은 합성곱 층과 풀링 층의 조합으로 구성된다. 합성곱 층은 기존의 선형층과 달리 커널(kernel)을 이용한 합성곱 연산으로 동작하며, 가중치 공유를 통해 더 적은 수의 파라미터로 이미지의 국부적인 패턴을 효과적으로 추출할 수 있다[6]. 본 논문에서 구현한 CNN 네트워크에서 입력 이미지 해상도는 224 × 224 픽셀로 동일하게 적용하였다. 신경망 구조는 총 3개의 합성곱 계층으로 이루어진 얕은 CNN으로, 첫 층은 7 × 7 커널(입력 채널 3 → 출력 채널 30) 합성곱과 ReLU, 풀링으로 구성되고, 이후 두 층은 3 × 3 커널(30 → 60, 60 → 120 채널) 합성곱과 ReLU, 풀링으로 구성된다. 최종 합성곱 출력은 크기가 120 × 28 × 28인 특성맵으로 평탄화(flatten)되며, 이를 전결합 층을 통해 256차원 특징 벡터 [TeX:] $$z_k \in \mathbb{R}^{256}$$로 변환한다. 이 모델의총 파라미터 수는약 2천 4백만개로, 대부분이 평탄화 후 94,080차원의 노드에서 256차원으로 줄이는 전결합층에 집중되어 있다. 한편 깊이는 합성곱계층 3개 수준으로얕은 편이며, 적은 계층으로 국부적인 패턴을 포착하는 역할을 수행한다. 그림(Fig.) 3. 다이버시티 기반의 LPI 신호 변조 분류 시스템 구조 (Architecture of a Diversity-Based Modulation Classification System for LPI Signals) 두 번째 ResNet 네트워크에선 입력 이미지 해상도는 동일하게 224 × 224 픽셀로 사용하였으며, ResNet-50으로 알려진 50층 깊이의 잔차 네트워크를 적용하였다[7]. ResNet-50은 매우 깊은 CNN을 잔차 스킵 연결 구조로 구현하여 층이 증가해도 학습이 가능한 대표적 모델이다. 본 논문에서는 torchvision의 사전학습된 ResNet-50을 불러와 최종 분류기를 제거한 뒤, 글로벌 평균 풀링(Adaptive Average Pooling)으로 7 × 7 공간 차원을 1로 축소하여 출력 특성맵 2048 채널을 얻는다. 이어서 2048차원 출력에 대해 전결합층을 적용해 CNN과 마찬가지로 256차원의 특징 벡터를 출력한다. ResNet-50 백본의 파라미터 수는 약 2천 5백만 개 수준으로, 이는 CNN과 유사하지만 대부분이 깊은 계층의 가중치에 분산되어 있다는 것이 특징이다. 네트워크 깊이가 깊고, 잔차 연결을 통해 매우 깊은 특성 표현도 효과적으로 학습할 수 있어 이미지 분류에서 높은 성능을 보여준다[7]. 세 번째 네트워크로는 EfficientNet-B2을 활용하였다. EfficientNet-B2는 모델 규모 대비 뛰어난 성능을 내는 효율적인 알고리즘으로 폭, 깊이, 해상도를 균형적으로 확장하는 compound scaling 기법을 통해 정확도를 높인 계열의 모델 중 하나이다[8]. 원래 EfficientNet-B2는 입력 해상도로 260 × 260 픽셀을 사용하지만, 공정한 비교를 위해 본 연구에서는 입력 이미지의 해상도를 224 × 224 픽셀로 동일하게 적용하였다. EfficientNet-B2 또한 ImageNet 사전학습 모델을 사용하였으며, 최종 분류 계층을 제거하여 특징 추출에 활용하였다. 이 모델은 심층분리 합성곱(Depthwise Separable Convolution) 등을 활용한 MBConv(Mobile Inverted Bottleneck Convolution) 블록들로 구성되어 파라미터 효율을 높인다. EfficientNet-B2의 출력 특성 맵 채널 수는 1408개이며, 글로벌 평균 풀링으로 공간 차원을 축소한 후 전결합층을 활용해 마찬가지로 256차원 특징 벡터로 변환하였다. 이 백본의 전체 파라미터 수는 약 9백만 개 정도로 CNN과 ResNet-50대비 1/3 수준에 불과하여 가장 경량 모델이지만, 유사한 성능을 달성할 수 있다는 특징을 가지고 있다. 첫 번째 단계인 백본 네트워크에서 세 가지 머신러닝 알고리즘을 TimeDistributed 환경에서 동일하게 활용하여 입력된 모든 CWD 이미지를 256차원의 벡터 시퀀스 형태로 특징을 추출할 수 있다. 추출된 특징 벡터들은 다음 단계인 통합 계층으로 전달되며, 통합 계층은 특징 벡터들을 결합하여 최종 신호의 변조 유형을 판별한다. 통합 과정의 상세한 내용과 각 기법의 이점은 다음 절에서 자세히 설명한다. 3.2 통합 계층백본 네트워크로부터 얻은 특징 벡터를 통합하여 하나의 통합된 표현으로 융합하기 위해 본 연구에서는 LSTM, 평균 풀링, 연결이라는 세 가지 통합 전략을 고려하였다. 이번 장에서는 각 방법의 알고리즘적 과정, 수학적 표현, 주요 하이퍼파라미터 방식에 대해서 소개하고, 변조 방식 분류에서의 장점과 한계를 설명한다. LSTM은 순환신경망의 일종으로, 시간에 따른 장기 의존성을 효과적으로 학습하기 위해 게이트 메커니즘을 도입한 모델이다[16]. LSTM 통합에서는 추출된 다수의 특징 벡터를 시계열 데이터로 간주하여 순차적으로 LSTM 네트워크에 입력한다. 시간 단계 t에서 LSTM 셀은 해당 특징 벡터 [TeX:] $$\mathrm{z}_t$$와 이전 숨겨진 상태 [TeX:] $$\mathrm{h}_{t-1}$$ 및 셀 상태 [TeX:] $$\mathrm{c}_{t-1}$$를 받아들여, 새로운 숨겨진 상태 [TeX:] $$\mathrm{h}_t$$와 셀 상태 [TeX:] $$\mathrm{c}_t$$를 계산한다. 이때, 입력게이트, 망각게이트, 출력게이트 등 게이트 구조를 통해 유용한 정보는 저장하고 불필요한 정보는 잊어버리면서 은닉 상태를 업데이트한다. 이러한 과정은 N개의 모든 특징 벡터에 대해 반복되며, 최종시점 t=N에서의 은닉 상태 [TeX:] $$\mathrm{h}_N$$가 통합된 특징 표현으로 간주된다. 수학적으로 보면, LSTM 통합은 다음과 같이 표현될 수 있다.
[TeX:] $$\left(\mathrm{h}_t, \mathrm{c}_t\right)=\operatorname{LSTMCell}\left(\mathrm{z}_t, \mathrm{~h}_{t-1}, \mathrm{c}_{t-1}\right)$$ 여기서 [TeX:] $$t=1, \ldots, N, \text { LSTMCell }$$은 LSTM의 순환 계산 함수를 나타내며, 최종 통합 벡터 z는 [TeX:] $$\mathrm{h}_N$$로 정의[TeX:] $$\left(\mathrm{z}=\mathrm{h}_N\right)$$ 된다. 본 논문에서는 LSTM 입력 차원을 백본 네트워크에서 출력되는 특징 벡터와 동일하게 256으로 설정하였으며, 은닉 상태의 크기 역시 256으로 설정하였다. LSTM 층은 1개를 사용하였다. 여기서 은닉 상태 크기는 모델 용량을 결정하는 핵심 하이퍼파라미터이며, 층 수 역시 모델의 복잡도를 조절하는 역할을 수행한다. LSTM은 순차적 시간 의존성을 학습하므로, 여러 프레임(채널) 간의 패턴 변화나 연속적 특징을 포착하기에 유리하며, 따라서 변조 신호 분류에서 시간 주파수 이미지 간의 상관관계나 변화 특성을 모델링 하는데 효과적이다. 또한, 게이트 구조를 통해 중요한 정보는 누적하고 불필요한 정보는 망각하므로, 긴 시퀀스에서도 의미 있는 특징을 보존하며 RNN의 기울기 소실 문제를 완화할 수 있다. 이로써 여러 개의 시간 주파수 이미지 패턴 처리에도 효과적으로 처리할 수 있다. 더욱이 가변 길이 시퀀스를 자연스럽게 처리할 수 있다는 장점이 있어 입력되는 특징 벡터의 개수 N이 상황에 따라 달라질 경우에도 LSTM은 패딩 처리 등으로 유연하게 대응이 가능하다. 그러나 뒤에서 다룰 평균 풀링이나 연결 대비 모델 복잡도와 학습 파라미터 수가 크게 증가한다. 그 결과 학습에 더 많은 데이터와 시간이 필요하다는 단점이 존재한다. 평균 풀링은 여러 특징 벡터를 산술 평균하여 하나의 벡터로 통합하는 방법이다. 수식으로 표현하면 통합 벡터는 [TeX:] $$\mathrm{z}=\frac{1}{N} \sum_{i=1}^N \mathrm{z}_i$$와 같이 계산된다. 이러한 평균 풀링은 구현이 단순하고 추가 학습 파라미터가 전혀 없는 접근법이므로 통합 단계에서 복잡도가 증가하지 않는다. 또한 여러 프레임의 특징을 평균함으로써 잡음이나 이상치의 영향이 완화되는 평활화 효과가 있다. 개별 시간 주파수 이미지에 존재하는 잡음은 평균 과정에서 상쇄되므로, 공통적으로 나타나는 신호의 핵심 패턴을 부각시킬 수있다. 이러한 특징들은 변조 신호 분류에서 여러 펄스에 일관되게 드러나는 변조 특징을 강조하고 일시적인 변동을 줄여주는 효과를 가지게 한다. 또한 LSTM과 다르게 특징 벡터들의 순서에 불편하다는 특성을 지닌다. 반면, 모든 프레임에 동일한 가중치를 부여하기 때문에, 중요 특성 벡터와 덜 중요한 특성 벡터를 구분하지 못한다는 한계를 지닌다. 예를 들어 한 특성 벡터에만 나타나는 결정적인 단서가 평균값에 묻혀버릴 수 있다. 연결을 통한 통합은 각 프레임의 특징 벡터를 단순히 연결하여 하나의 긴 벡터를 구성하는 방법이다. 예를 들어 N개의 특징 벡터 [TeX:] $$\mathrm{z}_1, \mathrm{z}_2, \cdots, \mathrm{z}_N \in \mathbb{R}^{256}$$가 있다면, 연결 방식 통합을 통해 [TeX:] $$\mathrm{z}=\left[\mathrm{z}_1, \mathrm{z}_2, \cdots, \mathrm{z}_N\right] \in \mathbb{R}^{256 \times N}$$로 단순 병렬 연결된다. 이러한 결합은 모든 특징을 그대로 보존하면서 하나로 묶는다는 특징을 가지고 있다. 자체적인 학습 파라미터나 연산은 없지만, 결과 벡터 차원이 커지므로 이를 처리하기 위한 후속 분류기의 설계가 중요하다. 본 논문에서는 256 × N 차원의 통합 벡터를 입력으로 받아 완전 연결 신경망을 통해 최종 분류를 수행하였으며, 이때 너무 높은 차원의 입력을 바로 다루지 않도록 중간에 512차원, 128차원 등의 은닉층을 두어 차원을 축소하고 특징 간 상호작용을 학습하도록 하였다. 이러한 연결 방식은 모든 프레임의 정보를 손실 없이 유지하므로, 통합 과정에서 어떤 특징도 평균이나 임의의 연산으로 사라지지 않는다. 이는 중요한 국소 특징이 어떤 특징 벡터에 나타날지 모르는 상황에서 모델이 알아서 해당 부분의 중요도를 학습하도록 허용한다. 통합 자체에는 가중치가 없지만, 이후 단계의 분류기가 학습을 통해 특징 벡터별 가중치를 적용할 수 있어 특정 벡터의 특징에 더 높은 중요도를 부여하는 등의 유연한 통합이 가능하다. 또한, 구현이 간단하고 LSTM처럼 순차 계산이 필요 없어 병렬 처리 및 계산 효율성이 높다는 장점을 가지고 있다. 한편, 특징 벡터를 단순 연결함에 따라 특징 벡터의 차원이나 이미지의 개수가 많아질 경우 통합 벡터의 차원이 매우 커져서 이를 처리하기 위한 분류기에서도 많은 파라미터가 필요해지고 학습 부담이 커질 수 있다. 또한, 입력 이미지의 개수가 가변적인 경우 직접적인 적용이 어렵다는 한계를 가지고 있다. 연결 방식은 고정된 개수의 특징 벡터를 필요로 한다는 측면에서 유연성이 떨어진다고 할 수 있다. 위 세 가지 방법을 통해 얻어진 통합 특징 벡터 z는 최종적으로 분류기에 입력되어 변조 방식을 예측한다. 분류기는 일반적으로 하나 또는 그 이상의 완전연결층으로 구성된 후 소프트맥스(softmax) 활성화 함수를 통해 각 클래스에 대한 확률을 산출하는 형태를 갖는다. 본 논문에서는 통합 벡터를 입력으로 2∼3개의 완전연결층과 ReLU 활성화, 드롭아웃 등을 차례로 적용한 후 출력층에서 클래스 개수만큼 뉴런을 통해 최종 확률을 계산하였다. Ⅳ. 시뮬레이션 결과본 장에서는 다이버시티 기반의 LPI 신호 변조 분류 시스템의 분류 성능에 대한 시뮬레이션 결과를 제시한다. 시뮬레이션을 위해 2장에서 제시한 시스템 모델을 바탕으로 각 신호 변조 방식별로 각각 3,000개씩 총 36,000개의 시간 주파수 이미지를 생성하였다. 이 데이터는 학습 및 검증을 위해 각 변조 방식별로 2,400개와 600개로 나누었다. 테스트를 위한 별도의 시간 주파수 이미지는 2,000개를 추가 생성하였으며, 테스트 이미지의 SNR은 –20 dB부터 10 dB까지 설정하였다. 그림 4는 단일 채널 CNN 분류기[6]와 제안된 CNN+LSTM 다이버시티 통합 모델의 채널 수(N)를 다르게 하여 SNR 변화에 따른 분류 정확도를 비교한 결과이다. 단일 채널만 사용할 경우, SNR = -10 dB 환경에서 분류 정확도는 약 65% 수준에 불과하여 낮은 SNR 조건에서 변조 패턴을 안정적으로 인식하기 어려움을 보인다. 그러나 다이버시티 통합 모델을 활용하여 다중 채널로 수신한 신호를 활용할 경우 정확도가 눈에 띄게 상승하는데, 특히 N=5일 경우 동일 SNR 구간에서 87.6%로 크게 개선되는 것을 확인할 수 있다. 이는 다이버시티 이득을 통해 AWGN 및 페이딩 잡음의 영향을 상쇄함으로써, 주요 변조 특징을 더욱 뚜렷하게 회복할 수 있음을 뜻한다. 또한, 채널 수가 1개에서 2개로 증가할 때 정확도 향상 폭이 가장 크며, 이후 채널을 3, 4, 5개로 점차 늘릴수록 그 증가폭은 완만해진다. 이는 처음 두 개의 독립된 관측만으로도 상당한 잡음 평균화 효과가 발생하고, 그 이후에는 추가적인 관측이 가져오는 정보 중복도가 높아져 효용이 감소하기 때문이다. 그림(Fig.) 4. 채널 수에 따른 CNN-LSTM 통합 분류기의 신호 분류 정확도 (Accuracy of the CNN-LSTM Integrated Classification Technique Based on the Number of Channels) 그림 5는 동일한 CNN 백본 네트워크에서 세 가지 특징 통합 방식(LSTM, 평균 풀링, 연결)을 적용하여, 3개 채널 입력 신호에 대해 SNR에 따른 분류 정확도를 비교한 결과이다. 전반적으로 세 방식 모두 단일 채널 대비 우수한 성능을 보이며, SNR이 높아질수록 그 차이는 줄어드는 경향을 확인할 수 있다. 특히, SNR이 –10 dB일 때 LSTM, 연결, 평균 풀링 순으로 각각 81.3%, 80.7%, 78%의 정확도를 보이고 있으며, 통합 방식에 따른 약간의 차이가 발생함을 볼 수 있다. 평균 풀링은 여러 채널에서 추출된 특징 벡터를 단순 평균하여 잡음의 영향을 효과적으로 상쇄하지만, 중요한 신호 특성까지도 함께 희석되어 일부 분류 성능 저하가 발생한다. 반면 연결 방식은 각 채널의 정보의 손실 없이 연결하여, 신호 내에서 존재하는 결정적 특징이 보존되고 분류기가 학습 과정에서 이 정보를 적극적으로 활용할 수 있다. LSTM 통합 방식이 연결보다 약간 더 우수한 성능을 보인 이유는, LSTM이 순차적 구조를 통해 각 채널의 특징 간 상호관계와 순차적 패턴을 추가적으로 학습할 수 있기 때문으로 해석된다. 즉, LSTM은 단순 정보 보존을 넘어, 시간 주파수 이미지 간에 존재할 수 있는 상관 관계나 패턴 변화를 모델 내 부분적으로 통합 및 최적화할 수 있음을 시사한다. 그림(Fig.) 5. 통합 방식에 따른 LPI 신호 분류 기법 정확도 (Accuracy of LPI Signal Classification Techniques Based on Integration Methods) 그림 6은 백본 네트워크로 CNN, EfficientNet-B2, ResNet-50을 각각 적용했을 때, LSTM 기반 다이버시티 통합 분류 성능을 비교한 결과를 보여준다. 모든 SNR 구간에서 ResNet-50과 EfficientNet-B2를 백본으로 활용한 모델이 기존의 단순 CNN 기반 모델보다 일관되게 더 우수한 분류 성능을 나타냈다. 특히 낮은 SNR 영역에서는 ResNet-50-LSTM과 EfficientNetB2-LSTM이 CNN- LSTM 대비 각각 7.9%, 7.2%의 높은 정확도를 기록하여, 신호 품질이 낮을 때 더욱 뚜렷한 성능 차이를 확인할 수 있었다. 이러한 결과는 동일한 통합 기법을 적용하더라도 초기 특징 벡터를 얼마나 정교하게 추출하는지가 전체 시스템 성능에 크게 영향을 준다는 것을 의미한다. 즉, 깊고 표현력이 풍부한 백본 네트워크일수록 LPI 신호의 잡음 환경에서 의미 있는 특징을 효과적으로 포착할 수 있어, 이후 다이버시티 통합 단계에서도 최적의 성능 향상이 이루어짐을 알 수 있다. Ⅴ. 결 론본 논문에서는 전자전 환경에서의 LPI 레이다 신호 탐지 및 변조 방식 분류 성능을 개선하기 위해, 다중 안테나 기반의 다이버시티 통합을 활용한 딥러닝 시스템을 제안하였다. 다양한 백본 네트워크(CNN, EfficientNet-B2, ResNet-50)와 통합 방식(LSTM, Concatenation, Average Pooling)을 적용하여 실험한 결과, 전반적으로 단일 안테나 대비 다중 안테나 신호 통합을 통해 변조 방식 분류 정확도가 크게 향상됨을 확인하였다. 이러한 결과를 바탕으로 본 연구는 실제 전장 환경에서 LPI 신호 탐지 및 분류 시 다중 안테나 구조와 다이버시티 통합 접근 방식의 유효성을 입증하였다. 향후 연구에서는 본 논문에서 제시된 방법을 바탕으로, 보다 실전적이고 현실적인 환경을 반영한 LPI 신호 분류 연구가 수행될 수 있을 것으로 기대된다. BiographyBiographyBiographyBiographyBiographyReferences
|
StatisticsCite this articleIEEE StyleS. Cho, H. Jung, Y. Kim, M. Lee, Y. Kim, "Deep Learning-Based Modulation Classification of LPI Radar Signals Using Multi-Antenna Diversity Integration," The Journal of Korean Institute of Communications and Information Sciences, vol. 51, no. 1, pp. 15-25, 2026. DOI: 10.7840/kics.2026.51.1.15.
ACM Style Sunghwan Cho, Haejoon Jung, Yongchul Kim, Myungsik Lee, and Yohan Kim. 2026. Deep Learning-Based Modulation Classification of LPI Radar Signals Using Multi-Antenna Diversity Integration. The Journal of Korean Institute of Communications and Information Sciences, 51, 1, (2026), 15-25. DOI: 10.7840/kics.2026.51.1.15.
KICS Style Sunghwan Cho, Haejoon Jung, Yongchul Kim, Myungsik Lee, Yohan Kim, "Deep Learning-Based Modulation Classification of LPI Radar Signals Using Multi-Antenna Diversity Integration," The Journal of Korean Institute of Communications and Information Sciences, vol. 51, no. 1, pp. 15-25, 1. 2026. (https://doi.org/10.7840/kics.2026.51.1.15)
|
