您当前的位置:首页生活正文

喜马拉雅AIGC开启音频行业的全新角逐

2022-03-08 09:21:48

随着音质传输的升级、智能交互的深化、终端场景的拓宽,在线音频内容消费时长伴随着技术升级正在加速驶入发展快车道。根据易观分析数据显示,2021年中国“耳朵经济”市场的活跃用户规模已达到8亿人次,其中在线音频细分市场的月活跃人数稳定在3亿人次,且呈现出稳步上涨的态势。

与此同时,技术的发展也在改变着音频内容生产的方式。 喜马拉雅作为音频行业的头部公司,凭借其在音频领域长期积累的内容优势,长期投入音频技术的研发,如今已经在大家熟悉的“PGC+UGC+PUGC”之外,运用全新的AIGC进一步丰富内容生态,升级音频内容生产模式。AIGC,已成为音频行业的又一角逐场。

AIGC——音频内容革命的下一站

据了解,喜马拉雅已在AI语音技术领域潜心钻研多年,并在内部专门成立了喜马拉雅智能语音实验室这一核心部门,长期专注于语音合成、识别、语音信号处理、编解码以及智能音效的研究和开发。目前,这一实验室的研究已颇具成果。

年初,喜马拉雅自研的跨语言语音合成创新技术论文,及其与中国科学技术大学合作的说话人日志技术研究论文,均被世界顶级学术会议“2022年IEEE国际音频、语音与信号处理会议”(2022 IEEE International Conference on Acoustics, Speech, and Signal Processing,ICASSP 2022)收录,并受邀于今年5月在新加坡举办的会议上向全球展示相关技术成果。

ICASSP 2022是ICASSP 第47届会议,会议主题为“以人为本的信号处理”,“以人为本”这一理念也是喜马拉雅技术发展的驱动力之一。喜马拉雅CTO姜杰表示,我们在技术的创新和应用中很重视观察人和AI交互协同能产生什么全新的价值增量。

与此同时,喜马拉雅也已将很多科研成果应用在了内容创作中。2021年9月,在一代评书大师单田芳先生逝世三周年之际,喜马拉雅智能语音实验室利用TTS语音合成技术,让先生“云遮月”嗓音在喜马拉雅再次响起。通过自主设计单独的韵律提取模块,并将其融入到 HiTTS 技术框架中,让单老的AI合成音仿佛本尊再现。

目前,喜马拉雅上已有80多部运用还原自单田芳先生声音的AI合成音制作的专辑,这些专辑在喜马拉雅也一直深受用户喜爱,多张评书专辑长期位列喜马相声评书热播榜前列,例如《卧虎藏龙》《蜀山剑侠传》等。

同时,2021年,还有新京报、环球时报、潇湘晨报、时代周报、海外网、刺猬公社等众多主流媒体入驻喜马拉雅,借助喜马拉雅TTS技术加速制作新闻类音频节目,快捷地实现了文字报道向音频的转化,让听众有了更多的渠道听到更权威的新闻。智能化、无人化的播报正在实现,极大降低了运行成本和操作门槛,批量化处理的语音合成技术保障了内容生产与播报的及时。相关行业从业者表示,这种播报方式也开辟了音频新媒体的新赛道,让优质报道有了触达用户的新方式,突破了内容传播的阈值,为传统广播媒体行业带来新变革。

不止是新闻播报,艾媒咨询报告显示,在线音频行业应用TTS技术产出高质量仿真语音,快速完成文本到语音的转化过程,极大加速了网络文学到音频内容的生产能力,扩充了内容传播的渠道。可以预见,在音频台顶流的小说领域,喜马拉雅将会实现多音色自动识别朗读,在音频技术上进行突破。

技术势能释放商业价值新想象

对于消费者来说,AIGC是对于内容的加持是一次成功的探索。艾媒咨询《2021年中国耳朵经济发展专题研究报告》显示,超过六成受访用户认为AI合成音频比普通音频节目更有趣,55.4%和48.5%的用户认为合成技术能增加内容丰富度和提高现有的音频节目质量。

在AIGC对于内容如此强大的增益背后,对于国内音频产业而言,技术越来越成为行业的重要竞争维度。易观报告显示,2021年,以喜马拉雅为代表的主流台不断投入技术研发,通过提升工业化水,助力创作者实现更优质的内容表达。喜马拉雅等头部音频台凭借自身的技术、团队、资金等优势深耕有声书、有声剧等赛道,丰富内容样态。

商业规模带动技术创新,技术创新反哺市场选择,形成了一种喜马拉雅商业规模和技术发展双驱动之下的良网络。AIGC不仅代表了一种技术价值的想象,其背后更是商业价值的全新拐点。报告显示,超过七成受访用户对AI技术在在线音频领域的发展前景看好。

目前,喜马拉雅的AIGC已经在多项案例中展现了进一步赋能合作IP及合作方的可能。除了“单田芳声音重现”系列专辑仍在继续更新,喜马拉雅被ICASSP 2022收录的自研跨语言语音合成技术,未来还可能让我们听到单田芳先生的“声音”来播讲英文内容。也许在不久的将来,“单田芳英文声音重现”将与此前官方授权的“单田芳评书” 和“单田芳声音重现”共同构成全新的“单田芳IP”矩阵。

期,喜马拉雅还基于自研的TTS框架,采集头部主播“喜道公子”的真声打造了AI主播“喜小道”,与AI续写应用“彩云小梦”合作,打造了首个从故事创作到演播均由AI完成的AI电台。据了解,彩云小梦入驻为喜马拉雅旗下网文创作台奇迹文学的写手,将其作品经AI主播“喜小道”有声化后,发布在喜马拉雅台。“AI续写+AI主播”的方式证明了AIGC已经拥有了自己形成完整生产闭环的能力,更诞生了一种全新的以“AIGC”功能为基础的“PUGC”,展现了AIGC及AI技术赋能创作广阔前景。

艾媒咨询分析师认为,随着AI智能产品的普及以及用户需求持续攀升,在线音频行业的创新内容仍具有较大的潜力和发展空间。喜马拉雅等头部企业如何进一步利用AIGC的“智能大脑”助力内容创作,值得期待。

关键词:

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!

虚拟

未来