从媒体到出版,微软智能语音技术如何激发内容生产力?

业界 作者:微软科技 2020-12-28 14:12:48 阅读:167
推广:爱奇艺黄金会员年卡¥128元,送QQ音乐会员。

(本文阅读时间:6分钟)

智能语音技术如何赋能行业发展?作为嗅觉敏锐的内容生产者,出版与媒体行业积极拥抱前沿科技带来的生产力革新,探索智能语音合成技术为行业转型带来无限可能。

在“AI无界 因你声动”活动的“AI+行业”圆桌讨论中,经济观察报商业观察研究部主编沈建缘,人邮社信息技术部副主任赖青,湛庐文化副总裁、湛庐阅读 APP 负责人陈漪,三联“中读” APP 内容总监俞力莎,虎嗅产品总监华善亮,微软亚太研发集团云计算与人工智能事业部产品总监丁秉公,微软亚太研发集团云计算与人工智能事业部语音组资深产品经理邱硕,共同分享了观点和洞察,快拿出小本本记下要点哦~

下文为速记整理,内容有所精简↓↓↓

邱硕:非常荣幸请到了众多一线媒体和出版行业的老师,他们对有声内容,对内容的消费形式有非常深刻的理解。第一个话题想请媒体老师聊聊,目前 AI 语音技术在媒体行业能够产生什么样的价值,有哪些应用场景?

华善亮:很感谢微软今天能创造这样一个环境,我深刻体会到视障人士对声音产品的需求。作为一个提供品质内容的媒体,虎嗅和微软正在智能语音合成方面开展合作。对于媒体而言,新闻的快速响应非常重要。音频出作品的速度比不上文字,毕竟需要加工的过程,从前每篇稿件至少需要一到两个小时才能达到满意的效果,而现在智能语音技术大大提升了生产效率。就虎嗅与微软合作的智能音频产品,用户能够感知到文章是 AI 读的,能够理解 AI 犯的一些小错误,但总体上体验比较满意。

沈建缘:疫情之前经济观察报就已经开始与微软合作,尝试用智能语音合成的方式在经济观察报的全媒体平台上传播原创内容。就在刚才播放视频时,听到那位17岁时失明的朋友诵读了古诗词(如下视频),我和观众们流泪了。声音之美这件事,寄托着人类的情感。每个人阅读同一篇古诗词感觉都不同,这背后体现出的人类智慧是机器无法媲美的,那么为什么微软所做的智能语音合成技术珍贵而重要呢?随着 5G 发展和 AI 技术的不断迭代,智能语音能够以舒适的方式,帮助人们保存各种各样的记忆,这非常符合时代发展的需求。

邱硕:新技术带来了新场景,新场景带来了新体验,我们也想问一下出版行业的几位老师,如何在出版行业运用 AI 语音技术?

陈漪湛庐一直在随着技术的演进和发展,为读者提供一些多样的图书形式,包括有声书、电子书等等,帮助读者在各种场景都能够阅读。到了 AI 时代,我们该做点什么呢?湛庐有版权的内容非常多,但却没有足够时间生产大量的有声内容,AI 语音技术能够帮助提升制作效率,减少制作成本,并且我们还可以定制自家品牌的声音。同时,我们希望 AI 朗读能够精益求精,不断带来情感越来越丰富、越来越具有理解力的有声书。

在 AI 技术能够赋能品牌的同时,我们也有所担忧。我们将购买越来越多有声书版权,希望也能够在技术支持下防止盗版和侵权现象的发生。

俞力莎:我们去年做了一个听土摩托讲生命八卦的智能语音定制专栏,土摩托(袁越)是三联生活周刊的资深主笔,我们在微软的帮助下定制了他的声音,尝试看看文字工作者的声音本身能不能成为传达内容的方式,帮助他们拓展边界。《三联生活周刊》顾名思义是周刊,但是三联中读 APP 现在做的《三联听周刊》有声版本比纸刊要滞后一周半左右才能上市,这是由于目前这一有声内容由真人主播来录制,在纸刊定版后,编辑需要将终版文章二次加工成录制版本,才能进行录制和后期制作。非常希望能够运用智能语音技术来提高生产效率。

赖青:因人力和经济效益有限,人邮社每年产出的有声书有限,大约只有五六十本。而伴随着技术的发展我们完全可以采用智能语音技术合成的方式,低成本、快速地推向市场,我相信这在一定程度上能够改变中国有声书市场,让文化知识精华以声音的方式高质量地向公众传播。当然,这其中还存在很多挑战,诸如科普类、心理学类、经济类书籍有大量图表,如何用声音表现它们,还存在一定的壁垒。

邱硕:AI 技术如何在使用过程中扬长避短?在媒体和出版行业,大家如何看待类似的问题?

赖青:随着 5G 时代的到来,每个人的声音、掌纹、指纹、虹膜……都是关键的钥匙,比如说开车、开门、打开家电等等。在这种背景下,如果要搭建一个供每个人进行语音定制的平台,需要加强对个人隐私的保护。

沈建缘:经济观察报有一个《观察家》的栏目,已经持续19年了。像孙立平、张维迎、周其仁、资中筠等经济领域大家,都会定期在这里发表独家的评论和观点。我们也在计划通过嘉宾的声音来传播他们的内容。我们希望未来有更多的学者用自己的声音去读他们的书。未来我们要在遵守道德伦理的基础上,通过人工合成的语音来实现。AI 技术的应用,需要和人的需求真正结合起来,还有很长的道路要走。

陈漪:我们现在的内容生产链条确实发生了一些变化,湛庐会建议作者在写作时用语音来梳理思路,慢慢沉淀为一本书。大家谈论的“纸电声”同步,不仅要思考的是“谁先走、谁后走”的问题,也同时要尊重创作者更愿意用什么方式来创作,用什么样的载体来呈现,是大家一起探讨的结果。

丁秉公:技术一直在向前发展的,善用就能够延伸人类自身能力。举例来说,许多企业领袖需要出席跨国会议,但每个人掌握的语言有限,比如客户使用德语,但参会的人需要听英文。在这种情况下,微软技术可以做到,客户在用德语说话的同时,系统用同样的音色将他的声音同声传译为英文,以此类推,这就是 AI 帮助人类突破能力边界的体现。同时,科技公司需要在道德的框架下使用 AI 技术,这也是微软不断思考的,微软内部设有人工智能伦理道德委员会及法务部门严格监督技术的伦理边界,确保技术在开发和使用的过程中不被滥用。

刚才各位媒体和出版界老师的观点给我们很大的启发。今后,我们还要继续与各领域的伙伴和专家一起不断探索!今天的活动非常好。谢谢大家!

体验有声内容创作工具平台:

https://speech.microsoft.com/audiocontentcreation

推荐阅读

圣诞送礼,我们可是专业的!
听说,每个职场人都是圣诞老人

点击,进入一只狗狗的奇幻冒险世界~

精彩活动

微软收购 GitHub 两年后...


 点击这里,立即体验内容创作工具平台!  
↓↓

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

关注数据与安全,洞悉企业级服务市场:http://www.ijiandao.com/
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

图库
关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接