搜狗与新华社新媒体中心联合发布全球首个站立式AI合成主播，你怎么看？

在过去的2018年，人工智慧成为了最火热的技术之一，AI技术不断发展，让越来越多的人开始担心，未来自己的工作会不会被机器人所代替，这种担忧看似很遥远，但是对于一些职业，变革已经悄然来临……

新华社联合搜狗公司开发的AI主播再次升级，新闻主播已经开始和人工智慧竞争了。

就在昨天，新华社同搜狗公司召开了战略合作签署仪式，双方共同推动媒体行业的创新发展，在仪式上，双方共同发布了全新的站立式AI主播——「新小浩」和全球首个AI女主播——「新小萌」。

升级后的AI主播仍以新华社主播邱浩为原型，之前发布的AI主播只能保持坐姿，表情相对僵硬，神态与播报内容结合不够贴切。而本次升级之后，「新小浩」不仅可以坐著播报，更能站起来，加入更多的肢体动作，带著各种手势及姿态，声情并茂的播报新闻，看起来更加真实，更加智能。

本次升级也实现了技术上的重大突破，在声音模型、图像模型方面，成果显著，并且对「搜狗分身」技术有了巨大的提升与完善。

针对文字与声音的转换，以及对声音的模拟，都是基于声音模型完成的，本次升级采用了领先的波形建模技术生成音频，通过直接为音频信号的原始波形建模，一次为一种音频样本建模，来改变这种范式。

与听起来更为自然的语音相同，使用原始波形意味著其能够为任意类型的音频建模。经过这一技术合成的声音，更富有情感，表现力得到极大提升。

图像方面，本次升级在肢体动作方面下足了功夫，使用了海量手势数据，为其肢体动作模型进行学习，实现了「新小浩」丰富的肢体动作，并且根据主播原型邱浩的播报行为习惯进行数据分析，归纳手部动作的习惯，让动作和播报内容相结合，不再「尬舞」。

关键点标记顺序

除了肢体动作，在唇部动作方面，也对唇形合成模型进行优化，对于唇部动作的关键点标记有了新的方案，唇部共计标注20个关键点，外唇12个，内唇8个，提高了动作捕获的准确性。经过一系列优化，AI主播的声音和口型配合将更加自然，更加流畅。

除了站立式AI主播，本次的另一个亮点是首个AI女主播，基于AI男主播的开发经验，AI合成女主播「新小萌」的定制周期大幅度缩短，播报效果和稳定性极大提升，AI女主播将于今年的全国两会报道上正式亮相，加入新闻报道队伍。此外合成AI女主播标志著「搜狗分身」技术的更加成熟，为更广泛的「复制」奠定了基础。

截止目前，AI主播已发稿3400余条，累计时长达10000多分钟，参与了如第五届世界互联网大会、首届进博会、2019春运、农历猪年春节等重要报道，不久的将来可实现量产。

将视野放宽，其实虚拟人物生成技术可应用领域较为广泛，AI主播只是其中最初级的尝试。在技术成熟，并且可以实现低成本复制之后，将应用于娱乐、医疗、健康、教育、法律、金融等多个领域，通过提供个性化的行业解决方案。

人工智慧的发展，正在让我们的生活变得更加美好，但是与此同时，又会让多少人失去工作？和人工智慧比起来，我们该如何凸显核心竞争力，这一问题值得深思。

搜狗与新华网合作开发的全球首个Al合成主播出现各大媒体的新闻页面。很多人惊奇主持人邱皓的逼真表现。Al合成技术的出现将能够代替一些简单重复的工作。比如列车广播室的播音员，飞机机舱内播音员，导游等相对简单的工作讲逐渐被Al智能语音所替代。Al合成机器人的出现将使机器逐渐在一些对于需要需要复杂程度较低的动作由机器人来完成。

Al智能语音的合成在电影制作，工程讲解，景点解说，战地采访都将会发挥越来越大的作用。

由于Al智能语音本身不需要人来进行语音播报，不需要休息，理论上只要设备运转正常机器都可以进行7乘以24小时工作。传统的播音员需要休息，在进行外景摄影时，记者或者播音员到达新闻发生地需要适应当地的时差，环境，播音员很难快速适应当地的环境，导致工作效率低下。而智能语音主持人的使用则完全不用担心主持人无法快速适应新的工作环境导致新闻工作无法继续进行。

在情感方面，主持人播音员因为收到新闻事件的影响容易出现笑场，情绪悲愤等无法控制等现象，使用Al合成技术则能够很好的避免这种现象的发生。

AI技术的突飞猛进

很好，搜狗是我原来视频上传的网站，现在和新华社联合，很高兴

解决人口就业率？零失误播报？省钱不？

可以给全国人民带来福利,何乐而不为呢？合作共赢??????