G.O.S.S.I.P 阅读推荐 2023-02-14 InfoMasker

IoT 1年前 (2023) admin

343 0 0

在论文推荐专栏三周年生日的今天，我们为大家推荐来自NDSS 2023的一篇关于语音窃听干扰的工作 InfoMasker: Preventing Eavesdropping Using Phoneme-Based Noise，由浙大网安巴钟杰研究员与其团队独立完成并投稿。

研究背景

在2017年，有研究人员发现利用超声波可以在人耳无法感知的情况下向手机等设备的麦克风中注入低频音频噪声[1], [2]。其主要原理如图一所示：由于麦克风的非线性，高频超声波在经过麦克风中的放大器时会自动解调出低频的声音。研究人员们基于这一原理开发出了多种应用，其中一种便是利用这一原理向环境中的电子窃听设备注入噪声，从而达到在不影响环境中用户的条件下保护用户隐私的目的。

然而，现有的这类方法存在明显的缺点。首先，目前的方法注入的噪声形式比较简单，利用现有基于深度学习的语音增强或者去噪模型，可以很容易的将注入的噪声去除。其次，目前的干扰方法有效的干扰距离较短，难以达到较大的保护范围。

图一：超声波自解调效应

研究成果

在该工作中，作者设计了一个基于语音音素和超声波隐蔽传输的语音防窃听系统InfoMasker。基于语音中包含的语义信息主要由其音素结构决定这一事实，作者首先提出了一种新的噪声构建方法（如图二所示），在尽量提升噪声中音素单元的密度的前提下，保证噪声序列和正常人类语音结构的相似性，使得噪声可以高效的干扰机器和人类听觉系统的识别。同时，为了保证系统的普适性，本文还提出了一种新的基于语音情绪特征的增广算法，保证在音素数据数量受限的条件下噪声的多样性，降低噪声中重复片段出现的概率。上述的噪声设计以及增广算法弥补了现有其他工作中噪声复杂度低的缺陷，使得现有去噪算法不能有效地去除本系统注入的噪声。同时由于噪声本身不包含语义信息，语音分离算法也难以将噪声分离，进一步保证了噪声的鲁棒性。

图二噪声构建流程

为了提高可发送的噪声能量上限，作者提出了一种基于下边带调制的超声波传输方法，可以将能量上限提高传统发送方式的1.5倍以上。同时，为了降低传输过程导致的噪声失真，作者基于超声发射探头的频响在噪声调制之前对其进行预补偿，提高了噪声与目标音频的相似性，保证噪声的干扰效果。

InfoMasker系统整体架构如图三所示。在具体使用过程中，每个用户只需要输入5秒左右的语音进行注册，系统会基于注册语音进行语料的匹配与增广。从这些语料中提取音素然后构建并发送噪声。为了进一步提高干扰效果，系统通过发射端预补偿的方法减少噪声的失真，同时通过下边带调制的方法来降低发送端产生的人耳可听的干扰噪声，提高发射能量的上限。进一步提高噪声的有效覆盖范围。

图三系统具体工作流程

数字域和真实场景下的实验结果表明，InfoMasker可以使得受扰语音在商用和开源语音识别系统上的识别准确率均低于50%，同时人类的听觉系统也难以识别受扰语音。为了验证系统在真实环境下的表现，作者在一个典型的办公室环境中部署了InfoMasker并模拟实际使用场景。实验表明，InfoMasker可以使得不同位置的智能设备所录制的语音的识别准确率下降70%以上。在鲁棒性方面，音素噪声的抗剥离能力尤为优秀，由于此类噪声在结构上具有高复杂性与高随机性，它能够有效打乱用户语音中的语言结构，使得现有的降噪算法和语音分离算法均无法有效去除此类噪声。

论文下载：

https://www.ndss-symposium.org/wp-content/uploads/2023/02/ndss2023_f457_paper.pdf

项目代码：https://github.com/desperado1999/InfoMasker

参考文献：

[1]G. Zhang, C. Yan, X. Ji, T. Zhang, T. Zhang, and W. Xu, “DolphinAttack: Inaudible Voice Commands,” in Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security (CCS), Dallas, Texas, USA, Oct. 2017, pp. 103–117. doi: 10.1145/3133956.3134052.

[2]N. Roy, H. Hassanieh, and R. Roy Choudhury, “BackDoor: Making Microphones Hear Inaudible Sounds,” in Proceedings of the 15th Annual International Conference on Mobile Systems, Applications, and Services, New York, NY, USA, Jun. 2017, pp. 2–14. doi: 10/gfvpdx.