摘 要
语音窃听技术一直受到国内外学者的广泛关注,尤其是在安全、情报和隐私领域。近年来许多研究表明,利用无线通信技术,我们可以窃听到目标区域内的声音,而不需要直接接触目标设备。本文将重点介绍利用Wi-Fi、RFID、UWB以及毫米波技术实现语音窃听的原理和应用。
一
无线信号实现语音窃听的原理
众所周知,声音和振动之间存在着密切的联系。当物体振动时,物体周围的空气也随之振动,从而产生声音。例如,传统的传感器,如麦克风、扬声器等,通过振膜振动实现声音和电信号之间的转换。现有的研究已经证实,通过感知声源或声源附近物体的振动也可以从中恢复声音。例如,激光窃听[1]通过激光器发射一束激光照射在目标物体(如窗户玻璃)上,能够实现非接触式、远距离、高灵敏度的监听。激光窃听技术通常受视距条件限制,且一次只能监测一个目标。无线信号因其在自由空间的传播特性,能够很好地避免这种缺陷。无线信号感知声音的原理其实就是感知这种声振动。当声源发声时,声源及其附近的物体会产生微小振动,无线信号在接触这些物体表面时会发生反射,反射回的信号中携带声振动特征,通过使用信号处理算法和机器学习技术能够从无线信号中恢复高质量语音信息。
二
实际应用技术案例
2.1 Wi-Fi实现语音窃听Wi-Fi技术广泛应用于无线网络通信,Wi-Fi路由器发射的信号可以穿透墙壁,覆盖较大的区域。利用Wi-Fi信号的微小变化,我们可以通过分析信号的强度(RSSI)和相位来还原目标区域内的声音。威斯康星大学麦迪逊分校研究团队提出了一种新的无线振动监测技术,它可以利用Wi-Fi信号来侦听扬声器产生的声音,甚至能够穿透隔音墙这类障碍物[2]。传统的声音采集方法需要将收音设备,如麦克风,放置在声源附近,而此类技术则不需要,其工作原理是:声音驱动扬声器产生微小振动,这会引起射频信号强度(RSSI)和相位发生轻微变化;该团队提出一种音频-射频转换(Acoustic-Radio Transformation,ART)算法,能够从这些变化中提取并还原出原始的音频信号。为了提高监测效率和质量,论文提出采用空间信号多样性技术,例如多天线盲定向和频率选择,来提高算法的检测效率。论文通过理论模型和测试结果,对语音监听各个方面进行深入研究。例如,它区分了利用Wi-Fi信号发射和反射两种不同的监听模式,后者产生的威胁更为严重。论文通过系列实验检验了不同影响因素,结果表明该技术可以在5米以外,甚至通过隔音墙成功恢复高质量语音信息。这种技术的突破性应用为非法监听活动提供了新的攻击面,极大威胁私人通信的安全性。
图1 利用Wi-Fi信号突破隔音墙实现语音窃听
2.2 RFID实现语音窃听随着无线传感技术在物联网时代的广泛应用,RFID技术作为一种重要的无线传感方式,也得到了长足发展。现有研究显示,RFID技术具有体积小、成本低和易于部署等优点,已经在语音感知方向取得重大突破。TagMic[3]首次提出利用RFID技术实现隐蔽监听的新概念。当声波撞击物体引起的振动,会对附着在物体表面上的标签的反向散射信号造成影响,进而可以恢复声音。尽管RFID读写器的采样率较低,标签上的振动幅度也很微小,通过MFCC、STFT等信号处理算法以及机器学习方法能够克服环境噪声和低采样率的影响,从RFID测量数据中提取有效特征。初步实验结果表明,TagMic能够实现93.1%的单词识别准确率,说明RFID技术在安全方面可能存在隐患。
图2 TagMic首次揭示使用RFID能够实现语音窃听
上海交通大学俞嘉地等人提出了一种名为RF-Mic的实时语音监听系统[4]。该系统通过在常见眼镜镜框上粘贴RFID标签来感知用户说话时的细微面部语音动态,从而推断可能的语音内容。论文首先提出了RFID信号感知人脸语音动态的传播模型。然后通过实验发现RFID信号可以感知三种类型的语音动态特征,及面部运动特征、骨传导振动特征以及空气传导振动特征。并提出利用不同深度学习模型分别提取这三种语音动态特征,并使用自注意力机制进行特征融合。此外,他们还提出了条件去噪自动编码网络去除人体运动干扰,以及对抗学习网络去除用户相关特征,实现鲁棒的语音监听。实验结果表明,在不同环境下,该系统可以实现88%以上的单词识别准确率和句子识别准确率。
图3 RF-Mic系统实现
南京大学王楚豫等人利用RFID标签实现了穿墙窃听[5]。他们使用诸如包裹、水瓶以及衣服等日常物品上粘贴的RFID标签对扬声器播放的声音进行感知。攻击者可以暗置标签在扬声器附近,并使用商用读写器对标签进行信号读取。他们分析了RFID信号在传输过程中的变化规律。在音波的影响下,标签或附近的物体会产生及其微小的振动,这会导致标签反向散射信号的相位发生变化。研究团队提出利用这一特点,设计了一种新的信号变化特征——调制信号差(Modulated Signal Difference,MSD),来放大振动信息并提取声音特征。为了解决RFID系统中由于读写器发送周期性命令的干扰,提出了随机化标签响应的方法。同时,为了提升从射频信号中提取的人声质量,利用条件生成对抗网络对低频带人声进行扩充,重建全频带声谱。实验结果表明,在1-4米距离下,利用提出的方法可以成功提取单音声音,信噪比达4dB以上。对数字和字母进行识别,在视距条件下实现窃听准确率分别为95.3%和87%;在非视距条件下(20毫米厚砖墙或29毫米厚隔声玻璃)也能实现85%以上识别准确率。
图4 RFID实现穿墙窃听
2.3 UWB实现语音窃听UWHear[6]利用射频信号和超宽带脉冲雷达技术直接从声源振动中提取音频信息,实现了室内多声源同时监测功能。这与传统使用麦克风的方法不同,如图5所示,后者获得的声音信号呈混合状态,难以清晰地区分各声源。UWHear使用脉冲射频超宽带(IR-UWB)技术。IR-UWB具有脉冲短、带宽窄的特点,能提供很高的距离分辨率。系统每发射出一个脉冲都会获得回波,从而构成一个二维框图,其中快时间轴代表目标距离,慢时间轴代表采样时序。研究人员通过理论推导证明,当声源产生振动时,其会造成IR-UWB信号和声源之间传播时间的细微变化。这会反映在I/O数据实部或虚部振幅的变化上,系统能根据这一依据来恢复声音信号。通过大量实验证明,系统能在8米范围内清晰监测声源,也可实现隔墙监听,不同声源之间的距离最短间隔为25厘米。总的来说,该项工作首次提出从UWB信号中获取声音的新方式,通过严谨的理论支持和实验验证了系统在复杂条件下多声源监测的潜力,为声事件检测及其应用带来了新的思路,值得进一步优化和开拓应用前景。
图5 利用UWB实现语音窃听
2.4 MM-Wave实现语音窃听当人说话时,发声器官会带动周围空气振动,产生声音脉冲。此外,其他组织,如舌头、颚骨等还会加工这些声音脉冲,形成丰富的语音信息。毫米波因其工作频段高,可以感知微米级振动幅度。WaveEar[7]是一种利用毫米波进行噪音消除的语音识别系统。通过采集近喉部振动信号,提取其中的语音信息。利用深度学习技术实现噪音环境下的语音识别。这为语音用户交互应用在复杂场景下提供了一种新的解决方案。罗格斯大学研究团队研究了一种新的通过毫米波辐射来窃听人声的远程手段[8]。研究指出,人声产生的振动可以通过周围物体表面产生微小的位移,这些位移可以被毫米波传感器捕获。研究人员设计了一种软件定义的相位阵列毫米波雷达来增强人声产生的微小振动的信号强度,使得从远距离和墙壁后面也可以成功捕获这类振动信息。
图6 利用毫米波实现语音窃听
三
总 结
本文从理论和实践两个层面研究了利用各种无线通信技术实现语音窃听的原理和方法。从物理原理上介绍,声音产生的振动可以通过无线信号在空间中的传播带来细微变化,这为语音信息的还原和提取提供了可能。而实际案例则给出了利用Wi-Fi、RFID、UWB以及毫米波技术实际实现语音窃听的多种技术方案,详细说明了系统设置、信号处理算法设计及实验效果。这些研究充分验证了无线信号在流动的属性,可以获取远距离和隐蔽的语音信息,给用户隐私和信息安全带来新的威胁。但同时也为声识别、人机交互等应用开拓了新思路。
参考文献
[1] Walker, P., & Saxena, N. (2022, June). Laser meager listener: a scientific exploration of laser-based speech eavesdropping in commercial user space. In 2022 IEEE 7th European Symposium on Security and Privacy (EuroS&P) (pp. 537-554). IEEE.
[2] Wei, T., Wang, S., Zhou, A., & Zhang, X. (2015, September). Acoustic eavesdropping through wireless vibrometry. In Proceedings of the 21st Annual International Conference on Mobile Computing and Networking (pp. 130-141).
[3] Li, Y., Duan, C., Ding, X., & Liu, C. (2020, November). Tagmic: Listening through rfid signals. In 2020 IEEE 40th International Conference on Distributed Computing Systems (ICDCS) (pp. 1187-1188). IEEE.
[4] Chen, Y., Yu, J., Kong, L., Kong, H., Zhu, Y., & Chen, Y. C. (2023). RF-Mic: Live Voice Eavesdropping via Capturing Subtle Facial Speech Dynamics Leveraging RFID. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies, 7(2), 1-25.
[5] Wang, C., Xie, L., Lin, Y., Wang, W., Chen, Y., Bu, Y., ... & Lu, S. (2021). Thru-the-wall eavesdropping on loudspeakers via RFID by capturing sub-mm level vibration. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies, 5(4), 1-25.
[6] Wang, Z., Chen, Z., Singh, A. D., Garcia, L., Luo, J., & Srivastava, M. B. (2020, November). UWHear: Through-wall extraction and separation of audio vibrations using wireless signals. In Proceedings of the 18th Conference on Embedded Networked Sensor Systems (pp. 1-14).
[7] Xu, C., Li, Z., Zhang, H., Rathore, A. S., Li, H., Song, C., ... & Xu, W. (2019, June). Waveear: Exploring a mmwave-based noise-resistant speech sensing for voice-user interface. In Proceedings of the 17th Annual International Conference on Mobile Systems, Applications, and Services (pp. 14-26).
[8] Shi, C., Zhang, T., Xu, Z., Li, S., Gao, D., Li, C., ... & Chen, Y. (2023, November). Privacy Leakage via Speech-induced Vibrations on Room Objects through Remote Sensing based on Phased-MIMO. In Proceedings of the 2023 ACM SIGSAC Conference on Computer and Communications Security (pp. 75-89).
来源:中国保密协会科学技术分会
作者:中国科学院信息工程研究所 白广轩作者:中国科学院信息工程研究所 白广轩
本页面二维码
© 版权声明:
本站资讯仅用作展示网友查阅,旨在传播网络正能量及优秀中华文化,版权归原作者所有。
如有侵权请尽快 联系我们 予以删除处理。
其他事宜可 在线留言 ,无需注册且留言内容不在前台显示。
了解本站及如何分享收藏内容请至 关于我们。谢谢您的支持和分享。
猜您会读:
-
《真实的谎言》30周年:90年代烧掉1亿美元,画面吊打当今特效
《真实的谎言》,在全球特效发展史上写下了浓墨重彩的一笔。文 | 臧剑* 特别感谢谢亚伦、王伟男对本文的贡献部分珍贵照片提供 | 约翰·布鲁诺排版编辑 | Joy作为詹姆斯... - 第一批受害者已出现撰文/ 黎炫岐编辑/陈邓新排版/Annalee用AI搜集资料、做PPT、改论文……虽然AI暂时还不能“替代”人类,但不可否认的是,AI正以前所未有的速度,渗透进普通...
- 2016年,马斯克成立了一家脑机接口公司,名叫Neuralink,宣称要打造出一种让人类大脑和外界进行信息交互的设备,如果此举真的能实现,那未来人类就能实现网友口中的赛博飞升。...
-
“我们跑高速去试驾都在车上睡”,车企销售人员极力宣传智驾系统的强大功能,淡化风险
4月1日,小米汽车智驾系统引发的事故在汽车行业内引发关注。资深汽车研发工程师周强(化名)在接受新黄河记者采访时指出,国内部分车企在智能驾驶系统的用户引导方面存在缺失... - 特朗普周五在白宫高调宣布,将第六代战机交由波音公司生产,并命名为F-47,以维持美国“下一代空中优势”(NGAD)。特朗普炫耀说,“这种隐形飞机几乎看不见,而且拥有前所未...
- 作者 | 姚西西来源 | 华商韬略(ID:hstl8888)33岁的刘靖康,等来了证监会的批复,不出意外,他将是科创板最年轻的董事长之一。他一手创立的影石创新(Insta360),用9年...
- 2025刚开年,来自杭州的两个年轻人,震撼了全球科技圈,到今天关于他们的讨论热度丝毫未减,成了这个春节当之无愧的“顶流”。他们就是宇树科技的创始人王兴兴与深度求索(Dee...
- 媒体并没带来更多有价值的思想;技术并没真正促进公平正义,当这两个怪物狼狈为奸时,资本站在旁边猥琐的窃笑,他们要收割百姓。现在的AI最大能耐就是吓唬,不学习就要淘汰,...
- 据《南华早报》报道,中国科学家已经研发出一款基于激光的全球最强大摄像机,能够从近地轨道识别辨别人脸等微小细节。报道指出,这款摄像机由中国科学院航空航天信息研究所的...
-
比Deepseek还强的Manus(马牛死)爆火:打工人的天彻底塌了
时代的列车太快,一不小心就闪了我的老腰。前几天我还信誓旦旦地说:AI只是工具,只是我们未来工作的协作者。没想到打脸来得这么快,Manus横空出世,彻底改变了我的想法。如果... - 3月10日,人民日报新媒体发布《献给春天的演讲:相信》。讲述人王兴兴是个“90后”,他开创了全球低成本高性能足式机器人的技术先河。他和团队研发的四足机器人已占全球近7成...
-
为了实现女儿买迪士尼玩偶、和玲娜贝儿合影的愿望,这个暑期,陈真被上海迪士尼“收割”了。1天1夜,花掉一万五,“这个钱都可以去趟马尔代夫了”。费用高,体验却较差,每一...
- 值得收藏!120个成语之“最”,好记又有趣!写作,没有点成语储备怎么行?试试这样背成语:最殷切的思念——一日三秋;最安静的时刻——万籁俱寂;最遥远的地方——天涯海角;...
-
16世纪明朝末年,公元1578年,意大利传教士利玛窦(Matteo Ricci)乘帆船离开欧罗巴之葡萄牙里斯本港,绕过非洲好望角抵达印度果阿。公元1582年,利玛窦从印度果阿出发,辗转...
- 2017年,在乌镇互联网大会,刘强东与王兴联手组局,邀请马化腾、高瓴资本张磊、滴滴程维、快手宿华、知乎周源、58同城姚劲波、金沙江创投朱晓虎、联想杨元庆、红杉资本沈南鹏...
- 11月10日,外交部发布《中华人民共和国政府关于黄岩岛领海基线的声明》,以下为全文:中华人民共和国政府关于黄岩岛领海基线的声明二〇二四年十一月十日中华人民共和国政府根...
- 本文深入探讨专制体制与民主制度在现代文明背景下的优劣势,通过系统剖析与案例研究,论断专制体制在与现代文明的较量中必然走向溃败。从历史发展、权力结构、社会公平、经济...
-
随着科技文明的不断发展,人类的视野和探索范围也随之不断延伸、扩张。曾经,人类对世界的理解仅限于头顶和脚下的方寸之地。现在,在科技力量的帮助之下,世界这一词语的含义...
-
中国C位-陕西省位于中国中部,南方和北方,东部和西部在这里成功牵手。中国的大地原点,就是测算经纬度的基准点,就在西安附近的泾阳县,在很长一段时间中国都在使用1980西安...
- 黄晓明今年46岁了,无论他有多迷恋偶像剧霸总人设,群众也不会再惯着他了。一个网红女朋友,又一次把这位影星送上了舆论高地。人到中年,一次官宣换来终生内向。网友不仅没有...
-
第一个:贵阳贵阳被誉为中国的避暑之都,当地有个口号叫“爽爽的贵阳”,是说这里的夏天凉爽舒适,体感温度特别舒服。夏季是贵阳一年中最美的季节,四周景区很多,出门游玩也...