草根影响力新视野(琪拉编译)

我们生活已经与人工智能密不可分,我们可以随时与人工智能进行对话,向聊天机器人提出问题,他们甚至会提供引人入胜的口头答案,您也可以使用多种语言与他们聊天,并请求以特定的方言或口音回复。

人工智能甚至可以复制真人的声音。最近,其中一个被用来复制已故英国广播员迈克尔·帕金森爵士的声音,以制作一个由八部分组成的节目。

这些技术甚至被用于复杂的骗局中,诱骗人们将钱交给犯罪分子。但并非所有人工智能生成的声音都被用于邪恶手段。它们也被内建到由大型语言模型支持的聊天机器人中,以便它们能够以更自然和令人信服的方式进行回应和交谈。

这些功能提出了一个有趣的问题:人类声音是否有任何独特之处可以帮助我们将其与机器人语音区分开来?

乔纳森·哈林顿 (Jonathan Harrington) 是德国慕尼黑大学语音学和数码语音处理教授,他花了数十年时间研究人类说话、发音和口音的复杂性。就连他也对人工智能语音合成器的功能印象深刻。“在过去 50 年里,尤其是最近,语音生成已经变得如此出色,以至于通常很难区分人工智能生成的声音和真实的声音。”他说。

扩音器 音频 背景 通讯 音乐会 控制台 数字 耳机 均衡器 设备 事件 头戴耳机 耳机 仪器 生活 混合 混频器 音乐 音乐 音乐家 党 性能 制片人 生产 专业的 收音机 记录 记录 唱 声音 舞台 三維声 工作室 技术 量
图片取自:(示意图123rf)

科学家曾经做过实验,令人惊讶的发现,大约有一半的人无法透过耳朵辨别真人或人工智能的声音。因为若人仅透过朵聆听,很难辨别哪个声音是人类的,哪个是人工智能的。

但专家认为仍然有一些重要的线索可以帮助我们判断我们是在与人类还是人工智能交谈。

目前专家已经在研究深伪检测软件正在帮助捕捉人耳可能错过的东西。对于人耳来说,人工智能的声音跟人类真实的声音没两样,但透过诈骗分类器运行它,它被标记为深度伪造。

另外,不自然的语音模式可能也是人工智能的声音。例如不守则的停顿和尴尬的措辞,扭曲和不匹配的背景噪音等奇怪的伪影也可能会露出马脚。

听句子中的重音或强调词可能是识别电脑生成语音的好技巧。像是‘玛丽安娜做了果酱’这样的句子,如果作为一个没有上下文的单独句子来阅读,通常最强调第一个和最后一个单词。但如果有人问玛丽安娜是否买了果酱,重点可能会落在答案中的“制造”一词上。

如果您怀疑正在交谈的声音可能不是人类,则可以尝试其他一些技巧。例如,你可以命令它尖叫。因为许多人工智能语音系统很难在正常音域之外说话,除非经过专门训练。

格伦南说,人类语言的缺陷可能是另一个泄漏的信息。纠正自己、重新思考自己的想法,是一件非常人性化的事情。 您不太可能听到 ChatGPT 说:“呃没关系!”或“你知道吗!?”

但在人工智能生成和人工智能侦测之间不可避免的军备竞赛中,我们可能会在日益虚拟互联的世界中失去实体互动。因此,当你在寻找是否在与人交谈时,解决方案很简单,那就是花更多时间面对面交流。

资料来源:https://www.bbc.com/future/article/