天天短讯!迄今最复杂人工智能语音模型创建
发布日期: 2023-06-26 21:04:45 来源: 科技日报


(资料图片)

Meta称研制出迄今最复杂人工智能语音模型。图片来源:英国《每日邮报》网站

科技日报北京6月25日电(记者刘霞)据英国《每日邮报》23日报道,脸书母公司元宇宙平台公司(Meta)称,其已研制出“迄今功能最强大的语音生成式人工智能Voicebox”,它能够模仿任何人的声音,包括逝者。不过,由于担心这项先进技术会被滥用,Meta宣布不会公开其人工智能模型。

Meta公司深度学习人工智能研究人员在介绍Voicebox时指出,Voicebox使用了“流匹配”方法,其表现优于当前最先进生成式语音系统使用的扩散模型。结果显示,Voicebox生成的人工音频更容易理解,单词错误率为1.9%,低于竞争对手的5.9%。此外,Voicebox生成的音频与真人的相似性更高,同时速度快了近20倍。

在跨语言翻译时,Voicebox的表现优于备受赞誉的多语言文本—语音AIYourTS,单词平均错误率从10.9%降低到5.2%,音频相似度从0.335提高到0.481。

Meta阐述了Voicebox的多种用途,称其可用来帮助视障人士听到朋友和亲人的信息,或允许非母语人士用自己的声音翻译自己所说的话。据悉,Voicebox目前能说6种语言:英语、法语、西班牙语、德语、波兰语和葡萄牙语。

不过,Meta强调称,由于潜在的滥用风险,他们目前不会公开Voicebox模型及其代码。虽然他们认为向人工智能社区开放并分享研究,对于推动人工智能向前迈进非常重要,但在开放与责任之间取得正确的平衡也至关重要。

【总编辑圈点】

ChatGPT横空出世半年多时间,人们已然深刻感受到人工智能语言模型的强大。对于各种提问,它都能对答如流,令人惊叹。试想一下,如果人工智能在回答人类的提问时,不仅内容形式酷似真人,就连声音也令人真假难辨,用户恐怕会感受到更强的冲击力。而后者,正是语音生成式人工智能要实现的目标。不过,正如文中所言,这些强大的技术确实有被滥用的可能,在人工智能技术不断升级迭代的同时,相关监管与伦理约束也要及时“上路”。

关键词:

相关文章

  • 世界热点评!车贷还清之后找谁办理?

  • 每日聚焦:为亚运喝彩|莫干山科技木以匠心成就每一次革新

  • 环球即时看!出交通事故以后去哪里做伤残鉴定-当前动态

  • 全球今头条!华西证券:给予王府井增持评级

  • 世界消息!欢乐家(300997):6月27日北向资金增持10.56万股

  • 热议:愿平安!汶川突发山洪泥石流,7人失联

  • 滁州市审计局“四强化、四做到”助力农业农村审计

  • 6月28日江西德安实业萤石价格暂稳

  • 焦点观察:6月28日山东华鲁恒升液氨报价持稳

  • 英国央行委员丁格拉:外部冲击尚未完全消退。

  • 七彩化学再收警示函 因业绩预告不准、信披不及时_世界通讯

  • 【世界播资讯】知情人士:MG印度公司正谋求增资扩股 上汽“不会失

  • 成都将新开6条国际航线 开通全国往返南美洲时间最短航班_世界快

  • 江西:织密“防护网”,筑牢“安全堤”

  • “6·18”网络零售额 厦门位居全省第一-全球速看料

  • 比亚迪在临朐成立汽车销售新公司

  • 中国首款!复星医药CAR-T创新产品新增二线适应症获批上市_全球热议

  • 怀化市集贤学校:“无纸化测试” 让学生“乐享”学习

  • 平乐税务:精细服务添动力 “春雨润苗”促发展 当前观点

  • 全球简讯:曼晚:亨德森确信自己会转会森林,他对留在曼联的提议

热点图集