新技术——无线信号实现语音窃听知多少

繁体

Livchan.cn 2024-07 添加书签书签列表

摘要

语音窃听技术一直受到国内外学者的广泛关注，尤其是在安全、情报和隐私领域。近年来许多研究表明，利用无线通信技术，我们可以窃听到目标区域内的声音，而不需要直接接触目标设备。本文将重点介绍利用Wi-Fi、RFID、UWB以及毫米波技术实现语音窃听的原理和应用。

一

无线信号实现语音窃听的原理

众所周知，声音和振动之间存在着密切的联系。当物体振动时，物体周围的空气也随之振动，从而产生声音。例如，传统的传感器，如麦克风、扬声器等，通过振膜振动实现声音和电信号之间的转换。现有的研究已经证实，通过感知声源或声源附近物体的振动也可以从中恢复声音。例如，激光窃听[1]通过激光器发射一束激光照射在目标物体（如窗户玻璃）上，能够实现非接触式、远距离、高灵敏度的监听。激光窃听技术通常受视距条件限制，且一次只能监测一个目标。无线信号因其在自由空间的传播特性，能够很好地避免这种缺陷。无线信号感知声音的原理其实就是感知这种声振动。当声源发声时，声源及其附近的物体会产生微小振动，无线信号在接触这些物体表面时会发生反射，反射回的信号中携带声振动特征，通过使用信号处理算法和机器学习技术能够从无线信号中恢复高质量语音信息。

二

实际应用技术案例

2.1 Wi-Fi实现语音窃听Wi-Fi技术广泛应用于无线网络通信，Wi-Fi路由器发射的信号可以穿透墙壁，覆盖较大的区域。利用Wi-Fi信号的微小变化，我们可以通过分析信号的强度（RSSI）和相位来还原目标区域内的声音。威斯康星大学麦迪逊分校研究团队提出了一种新的无线振动监测技术，它可以利用Wi-Fi信号来侦听扬声器产生的声音，甚至能够穿透隔音墙这类障碍物[2]。传统的声音采集方法需要将收音设备，如麦克风，放置在声源附近，而此类技术则不需要，其工作原理是：声音驱动扬声器产生微小振动，这会引起射频信号强度（RSSI）和相位发生轻微变化；该团队提出一种音频-射频转换（Acoustic-Radio Transformation，ART）算法，能够从这些变化中提取并还原出原始的音频信号。为了提高监测效率和质量，论文提出采用空间信号多样性技术，例如多天线盲定向和频率选择，来提高算法的检测效率。论文通过理论模型和测试结果，对语音监听各个方面进行深入研究。例如，它区分了利用Wi-Fi信号发射和反射两种不同的监听模式，后者产生的威胁更为严重。论文通过系列实验检验了不同影响因素，结果表明该技术可以在5米以外，甚至通过隔音墙成功恢复高质量语音信息。这种技术的突破性应用为非法监听活动提供了新的攻击面，极大威胁私人通信的安全性。

新技术——无线信号实现语音窃听知多少

图1 利用Wi-Fi信号突破隔音墙实现语音窃听

2.2 RFID实现语音窃听随着无线传感技术在物联网时代的广泛应用，RFID技术作为一种重要的无线传感方式，也得到了长足发展。现有研究显示，RFID技术具有体积小、成本低和易于部署等优点，已经在语音感知方向取得重大突破。TagMic[3]首次提出利用RFID技术实现隐蔽监听的新概念。当声波撞击物体引起的振动，会对附着在物体表面上的标签的反向散射信号造成影响，进而可以恢复声音。尽管RFID读写器的采样率较低，标签上的振动幅度也很微小，通过MFCC、STFT等信号处理算法以及机器学习方法能够克服环境噪声和低采样率的影响，从RFID测量数据中提取有效特征。初步实验结果表明，TagMic能够实现93.1%的单词识别准确率，说明RFID技术在安全方面可能存在隐患。

新技术——无线信号实现语音窃听知多少

图2 TagMic首次揭示使用RFID能够实现语音窃听

上海交通大学俞嘉地等人提出了一种名为RF-Mic的实时语音监听系统[4]。该系统通过在常见眼镜镜框上粘贴RFID标签来感知用户说话时的细微面部语音动态，从而推断可能的语音内容。论文首先提出了RFID信号感知人脸语音动态的传播模型。然后通过实验发现RFID信号可以感知三种类型的语音动态特征，及面部运动特征、骨传导振动特征以及空气传导振动特征。并提出利用不同深度学习模型分别提取这三种语音动态特征，并使用自注意力机制进行特征融合。此外，他们还提出了条件去噪自动编码网络去除人体运动干扰，以及对抗学习网络去除用户相关特征，实现鲁棒的语音监听。实验结果表明，在不同环境下，该系统可以实现88%以上的单词识别准确率和句子识别准确率。

新技术——无线信号实现语音窃听知多少

图3 RF-Mic系统实现

南京大学王楚豫等人利用RFID标签实现了穿墙窃听[5]。他们使用诸如包裹、水瓶以及衣服等日常物品上粘贴的RFID标签对扬声器播放的声音进行感知。攻击者可以暗置标签在扬声器附近，并使用商用读写器对标签进行信号读取。他们分析了RFID信号在传输过程中的变化规律。在音波的影响下，标签或附近的物体会产生及其微小的振动，这会导致标签反向散射信号的相位发生变化。研究团队提出利用这一特点，设计了一种新的信号变化特征——调制信号差（Modulated Signal Difference，MSD），来放大振动信息并提取声音特征。为了解决RFID系统中由于读写器发送周期性命令的干扰，提出了随机化标签响应的方法。同时，为了提升从射频信号中提取的人声质量，利用条件生成对抗网络对低频带人声进行扩充，重建全频带声谱。实验结果表明，在1-4米距离下，利用提出的方法可以成功提取单音声音，信噪比达4dB以上。对数字和字母进行识别，在视距条件下实现窃听准确率分别为95.3%和87%；在非视距条件下（20毫米厚砖墙或29毫米厚隔声玻璃）也能实现85%以上识别准确率。

新技术——无线信号实现语音窃听知多少

图4 RFID实现穿墙窃听

2.3 UWB实现语音窃听UWHear[6]利用射频信号和超宽带脉冲雷达技术直接从声源振动中提取音频信息，实现了室内多声源同时监测功能。这与传统使用麦克风的方法不同，如图5所示，后者获得的声音信号呈混合状态，难以清晰地区分各声源。UWHear使用脉冲射频超宽带（IR-UWB）技术。IR-UWB具有脉冲短、带宽窄的特点，能提供很高的距离分辨率。系统每发射出一个脉冲都会获得回波，从而构成一个二维框图，其中快时间轴代表目标距离，慢时间轴代表采样时序。研究人员通过理论推导证明，当声源产生振动时，其会造成IR-UWB信号和声源之间传播时间的细微变化。这会反映在I/O数据实部或虚部振幅的变化上，系统能根据这一依据来恢复声音信号。通过大量实验证明，系统能在8米范围内清晰监测声源，也可实现隔墙监听，不同声源之间的距离最短间隔为25厘米。总的来说，该项工作首次提出从UWB信号中获取声音的新方式，通过严谨的理论支持和实验验证了系统在复杂条件下多声源监测的潜力，为声事件检测及其应用带来了新的思路，值得进一步优化和开拓应用前景。

新技术——无线信号实现语音窃听知多少

图5 利用UWB实现语音窃听

2.4 MM-Wave实现语音窃听当人说话时，发声器官会带动周围空气振动，产生声音脉冲。此外，其他组织，如舌头、颚骨等还会加工这些声音脉冲，形成丰富的语音信息。毫米波因其工作频段高，可以感知微米级振动幅度。WaveEar[7]是一种利用毫米波进行噪音消除的语音识别系统。通过采集近喉部振动信号，提取其中的语音信息。利用深度学习技术实现噪音环境下的语音识别。这为语音用户交互应用在复杂场景下提供了一种新的解决方案。罗格斯大学研究团队研究了一种新的通过毫米波辐射来窃听人声的远程手段[8]。研究指出，人声产生的振动可以通过周围物体表面产生微小的位移，这些位移可以被毫米波传感器捕获。研究人员设计了一种软件定义的相位阵列毫米波雷达来增强人声产生的微小振动的信号强度，使得从远距离和墙壁后面也可以成功捕获这类振动信息。

新技术——无线信号实现语音窃听知多少

图6 利用毫米波实现语音窃听

三

总结

本文从理论和实践两个层面研究了利用各种无线通信技术实现语音窃听的原理和方法。从物理原理上介绍,声音产生的振动可以通过无线信号在空间中的传播带来细微变化,这为语音信息的还原和提取提供了可能。而实际案例则给出了利用Wi-Fi、RFID、UWB以及毫米波技术实际实现语音窃听的多种技术方案,详细说明了系统设置、信号处理算法设计及实验效果。这些研究充分验证了无线信号在流动的属性,可以获取远距离和隐蔽的语音信息,给用户隐私和信息安全带来新的威胁。但同时也为声识别、人机交互等应用开拓了新思路。

参考文献

[1] Walker, P., & Saxena, N. (2022, June). Laser meager listener: a scientific exploration of laser-based speech eavesdropping in commercial user space. In 2022 IEEE 7th European Symposium on Security and Privacy (EuroS&P) (pp. 537-554). IEEE.

[2] Wei, T., Wang, S., Zhou, A., & Zhang, X. (2015, September). Acoustic eavesdropping through wireless vibrometry. In Proceedings of the 21st Annual International Conference on Mobile Computing and Networking (pp. 130-141).

[3] Li, Y., Duan, C., Ding, X., & Liu, C. (2020, November). Tagmic: Listening through rfid signals. In 2020 IEEE 40th International Conference on Distributed Computing Systems (ICDCS) (pp. 1187-1188). IEEE.

[4] Chen, Y., Yu, J., Kong, L., Kong, H., Zhu, Y., & Chen, Y. C. (2023). RF-Mic: Live Voice Eavesdropping via Capturing Subtle Facial Speech Dynamics Leveraging RFID. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies, 7(2), 1-25.

[5] Wang, C., Xie, L., Lin, Y., Wang, W., Chen, Y., Bu, Y., ... & Lu, S. (2021). Thru-the-wall eavesdropping on loudspeakers via RFID by capturing sub-mm level vibration. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies, 5(4), 1-25.

[6] Wang, Z., Chen, Z., Singh, A. D., Garcia, L., Luo, J., & Srivastava, M. B. (2020, November). UWHear: Through-wall extraction and separation of audio vibrations using wireless signals. In Proceedings of the 18th Conference on Embedded Networked Sensor Systems (pp. 1-14).

[7] Xu, C., Li, Z., Zhang, H., Rathore, A. S., Li, H., Song, C., ... & Xu, W. (2019, June). Waveear: Exploring a mmwave-based noise-resistant speech sensing for voice-user interface. In Proceedings of the 17th Annual International Conference on Mobile Systems, Applications, and Services (pp. 14-26).

[8] Shi, C., Zhang, T., Xu, Z., Li, S., Gao, D., Li, C., ... & Chen, Y. (2023, November). Privacy Leakage via Speech-induced Vibrations on Room Objects through Remote Sensing based on Phased-MIMO. In Proceedings of the 2023 ACM SIGSAC Conference on Computer and Communications Security (pp. 75-89).

来源:中国保密协会科学技术分会

作者：中国科学院信息工程研究所白广轩作者：中国科学院信息工程研究所白广轩

展开全文