ChatGPT制造商OpenAI正在进语音助手业务,并展示了可以克隆人的声音的新技术,但表示出于安全考虑,尚未公开发布该技术。
这家人工智能公司周五推出了新的语音引擎技术,距离提交该名称的商标申请仅一周多。该公司声称,只需录制一个人说话的 15 秒,就可以重现该人的声音。
OpenAI 表示,它计划与早期测试人员一起预览该技术,“但目前不会广泛发布这项技术”,因为存在滥用的危险。
这家旧金山公司在一份声明中表示:“我们认识到,生成类似于人们声音的语音存在严重风险,这在选举年尤其重要。”
在新罕布什尔州,当局正在调查初选前向数千名选民发送的机器人电话,其中包含人工智能生成的模仿乔·的声音。
许多初创公司已经销售语音克隆技术,其中一些技术可供公众或娱乐工作室等特定商业客户使用。
OpenAI 表示,早期语音引擎测试人员已同意在未经他人同意的情况下不会冒充他人,并透露这些声音是人工智能生成的。该公司以其聊天机器人和图像生成器 DALL-E 而闻名,在宣布但没有广泛发布其视频生成器 Sora 时也采取了类似的方法。
然而,3 月 19 日提交的商标申请显示,OpenAI 可能旨在进入语音识别和数字语音助手业务。最终,改进此类技术可以帮助 OpenAI 与亚马逊 Alexa 等其他语音产品竞争。