小到视频配音、有声阅读,大到呼叫中心、车载语音交互,智能语音的应用场景越来越广泛,市场规模和需求也逐步攀升。一些企业正在通过“定制化”音色的方式,在加强自身IP建设的同时,为客户带来更加沉浸、自然的声音体验及多样化的玩法。基于硅基智能在AIGC业务的需求,火山引擎为硅基智能量身定制了多个精品音色,既包含著名的行业IP人物,也涉及多位知名的企业家。

硅基智能是一家以服务智能化和知识智能化为核心的人工智能创新企业,以自研DUIX操作系统为核心,通过打造开放开源、集体进步、任劳任怨的硅基劳动力,为客户提供近乎无限供给的数字员工,大幅度降低组织成本,快速提升组织效率,让客户在数字化转型中拥有以算力为核心的创新竞争力。

日常音色处理,有力支撑AIGC业务

语音合成技术,是人工智能领域的重要组成部分。伴随着AIGC的兴起和逐步落地应用,当前,越来越多的企业正在通过AIGC的方式打造自身IP形象,一些企业更是希望在线上打造企业家或知名人物的“数字分身”,去亲近消费者。

然而,企业家和知名人士在繁忙的工作日程当中,难以抽出大量时间,在录音棚内录制高品质声音。语音合成又对原生语音的音质、音色、语调以及背景噪音方面都有极高的要求。

火山引擎精品音色定制产品,可以根据日常录音和采访对话等原生数据,进行深入分析和处理,并通过降噪、针对性的声音提取等创新方案的不断迭代,解决日常对话多人、设备噪音、摩擦底噪等难题,进而产出高品质的定制音色。

在硅基智能的AIGC业务场景中,火山引擎与硅基智能联手打造了高品质的音色,满足了不同客户对声音的需求。

多场景触达,全面保障音色音质

火山引擎精品音色定制  让AI更具“人情味” 第1张

在强调视频化、个性化、体验化的今天,如何满足用户的多样化“声控”需求?怎么通过真实、自然、流畅的合成音色,强化自身IP、吸引并留住用户?是很多提供音视频服务企业正在思考的问题。

火山引擎精品音色定制,是一套为客户打造的专属精品音色解决方案,支持多情感、多风格、多语种的个性化定制,能结合客户实际应用场景需求,量身打造符合场景特点的定制化音色:

· 针对智能硬件的语音交互场景(如手机、车载系统、智能台灯):火山引擎提供了高度拟人化的播报声音,使人机之间互动更真实,从而提升用户体验和转化率;

· 将AI播讲应用于有声小说领域:可以帮助用户在听书模式下解放双眼,将内容转化为更加引人入胜的声音体验。有效提高用户听书时间,增加应用的活跃度;

· 将定制IP、趣味方言等个性化音色应用于视频、广告配音等场景:可提升音视频内容生产效率,打造更多元、便捷的内容生产方式;

· 定制专业主播音色,将声音应用到有声资讯以及新闻App中:可减轻主播录音工作压力,提升新闻内容制作效率,还能为视障人士、老年人提供无障碍的有声阅读环境;

· 为在线教育场景定制老师音色:能够减少老师重复性、标准化讲解的工作,提升授课效率,从而创造更高效的教学体验;

除应用场景丰富多样以外,火山引擎精品音色定制:

· 在技术上,使用自研的行业领先的端到端语音合成技术,提供自然流畅的听感体验;

· 在效果上,仅需1-2个小时录音棚原音,即可实现MOS值4.2以上的还原效果,高度还原真人录音的风格及发言特点;

· 在保障上,通过丰富的发音人与录音棚资源,自身的语音语言学专家和录音指导专家,满足语种和风格定制需求,全面保障录音与效果数据质量;

经过抖音集团大量实践验证及长期的行业深耕,火山引擎通过领先的端到端语音合成技术,可为企业提供17+种语言、13+种方言、100+种不同风格的合成音色,为用户打造“声”临其境的真实体验。

目前,火山引擎精品音色的定制产品已广泛服务包括抖音、剪映、番茄小说、今日头条等内部客户,外部服务如合众汽车、追书神器、配音鸭等客户;未来,火山引擎将持续以音色定制产品为引领,不断推进技术创新,通过更加逼真、自然、富有情感的声音合成技术,为企业级客户打造更个性化,更具“人情味”的音色解决方案。