前沿聚焦 | 迈向AGI时代, 网络视听的希冀与挑战

导读

 

人工智能(AI)发展日行千里,持续催生新技术、新产品、新产业、新业态、新模式。网络视听在AI浪潮下加速演进,已经成为以数字化、网络化、智能化为支撑,具有高科技、高效能、高质量重要特征的融合性生产力形态。网络视听行业应高度重视生成式人工智能等技术带来的新机遇,不断拓展网络视听业务形态、产业生态,促进网络视听创新发展。

 

视听领域新技术与新应用场景的探讨,是第十一届中国网络视听大会重点关注的议题之一:30余场主题论坛和发布活动中,就有9场技术类活动;多位发言嘉宾也分享了网络视听技术相关的观点和判断。

 

 

在开幕式上,作家阿来以其亲身体验讲述了他适应“数字化生存”的历程——他在博客时代的尾巴才适应敲击键盘写作,却眼见博客迅速被微博取代;当他还在探索微博短平快的交流方式时,短视频时代的洪流又汹涌而至;他也开始利用短视频的形式,讲授古诗词,将原本局限于学术殿堂或实体课堂的文化内容推向更为广阔且多元化的用户;而一个多月前,文生视频模型Sora又再次掀起AI浪潮,迈向“世界模拟器”。

 

从博客到微博再到短视频的转变,每个阶段都见证了人们注意力模式和内容消费习惯的快速调整。这不仅展现了当今时代技术发展和文化产品生产与消费快速变迁的进程,也折射出新技术对网络视听行业的颠覆性影响,提示我们对新技术保持一分警醒与注意。

 

一、科技创新赋能网络视听高质量发展

 

 

以2022年底人工智能研究公司OpenAI发布大语言模型ChatGPT为标志,人工智能技术研发和应用迈向了从“专用人工智能”(Artificial Narrow Intelligence,ANI)向“通用人工智能”(Artificial General Intelligence,AGI)的转变。

 

特别是2023年以来,大语言模型研发和应用成为科技颠覆式创新的核心突破点。相比于此前“元宇宙”的“秀技术”热潮,生成式人工智能显得更加务实,网络视听行业更加重视“用技术”,以生成式人工智能及其关联技术革新生产力,提升用户体验。

 

(一)生成式AI技术引领网络视听全链路创新

 

一是AI大模型爆发式增长。从全球范围看,世界各地均在积极推动大模型研发和应用,美国和中国是大模型技术领域的引领者。数据显示,截至2023年底,中美两国发布的通用大模型总数占全球发布量的80%。截至2023年12月,中国发布的10亿级参数规模以上的大模型多达234个,大模型的参数量和参数规模均呈现指数级增长。

 

大模型打开了生成式AI的魔盒。今年2月以来,Sora等文生视频模型、Kimi等文本生成模型以及Suno等音频生成模型轮番展现了AI的多模态生产能力。中国主要网络视听平台纷纷发布自有大模型或AI产品。如中央广播电视总台的“央视听媒体大模型”、腾讯的“混元大模型”以及湖南广电的AI导演“爱芒”、抖音的AI助手“豆包”。

 

二是生成式AI技术推动网络视听生产力持续革新。主要网络视听平台均将生成式AI技术引入内容生产和日常运营,借助其语言理解能力、美术和创意的发散能力,平台在创意策划、信息获取、内容生产、渠道分发、运营推广、效果评估、内容治理等各环节的效率或者用户体验大大提升。

 

近期,多部生成式AI内容上线,与文化艺术相结合有望加速AI生成应用破圈。总台密集推出文生视频AI动画片《千秋诗颂》、AI全流程微短剧《中国神话》等多部生成式AI作品,其美术、分镜、视频、配音、配乐全部由AI完成。优酷剧集《大唐狄公案》用“AI+数字资产”的方式生成了唐代长安城,制作效率提升近70%;《异人之下》使用了AI数字人演员“厘里”,让制作成本降低80%,效率提升40%。芒果TV的短视频业务的标题、封面、配音、配乐等内容均由AI自动化生产;仅2023年,站内AI自动化生产的短视频数量已接近100万条。爱奇艺AI海报曝光占比达35%,其3.6%的点击率也高于人工海报0.5个百分点。

 

未来,随着文生视频模型的不断成熟和规模化应用,将有效缩短IP开发时间,降低IP开发成本,放大IP价值,累积数据价值,成为内容生产的加速器和内容价值的放大器。

 

(二)虚拟制作、超高清技术驱动网络视听产业升级

 

一是网络视听行业实现超高清规模化部署。主要网络视听平台从内容制作、平台分发、终端呈现等环节持续布局、优化超高清技术。2023年,爱奇艺、腾讯视频、咪咕、芒果TV、华为视频等平台上线了超三万小时的HDR Vivid标准内容,包括《狂飙》《三体》《繁花》等优质剧集。华为、荣耀、小米、OPPO、三星、康佳、创维等17家的电视机、手机、PAD、机顶盒、PC等五类111个型号/系列终端通过HDR Vivid认证。

 

二是虚拟制作推动影视拍摄提质增效。虚拟制作是集数字资产、虚拟预演、虚拟拍摄、现场剪辑、后期制作等环节于一体的全流程实时可视化制作体系,能够将实景与数字场景完美融合。我国在虚拟拍摄领域的硬件和技术研发上已处于全球领先地位,这为网络视听行业的高质量发展提供了坚实的技术基础。

 

2023年以来,虚拟制作技术在影视制作领域广泛应用,《云之羽》《狐妖小红娘·月红篇》《清明上河图密码》等网络剧均采用“实景+影视虚拟制作”方式拍摄,为用户带来更真实、更震撼的观影体验。爱奇艺借助虚拟拍摄,部分场次里导演的拍摄效率提高了30%以上,现场人员减少了1/3;截至2023年底,优酷通过影视数字管理平台支持了《异人之下》等1500余个拍摄项目的资产回收复用,累计回收资产35万件,节约成本超1.3亿元。

 

(三)新技术推动多产业融合与升级

 

一是网络视听赋能多产业向“新”而行。网络视听与文旅、教育、农业等产业深度融合通过内容创新和技术创新,构建起新内容、新消费、新产业的多元化生态体系,成功带动相关产业消费升级、品牌推广,形成多元化的产业生态和新的消费市场。淄博烧烤、哈尔滨冰雪、甘肃麻辣烫等案例,借助短视频与直播实现“出圈”,带动区域旅游和特色产业发展,形成线上线下融合的新型消费场景,充分显示了网络视听对实体产业的显著赋能作用。

 

二是网络视听应用场景持续拓展。物联网(IoT)和车联网快速发展,网络视听平台通过与汽车厂商共建车联网、与家电企业合作打造智能物联家居等方式,加速推进网络音视频服务在车载娱乐系统、智能音箱、智能家居、穿戴设备等终端的整合应用,网络视听应用场景不断“破圈”。

 

随着AI技术和智能汽车的发展成熟,智能驾舱被视为第三空间,将能够提供更加丰富的交互体验,成为人们生活、工作和娱乐的新场景和网络视听的新入口。AI将推动智能座舱交互实现从被动响应用户指令到主动服务的转变,通过车内摄像头、传感器等设备识别场景,基于情绪识别、场景感知,提供个性化内容推荐和交互体验,如根据早高峰场景主动播报新闻、识别儿童乘客时调整推送内容。

 

二、在技术变革中保持警醒

 

 

在对AGI充满期待的同时,也要看到技术的两面性,时刻警惕新技术带来的新挑战。中央宣传部副部长,国家广播电视总局党组书记、局长曹淑敏在开幕式致辞中强调,网络视听本身是技术创新的产物,天生具有创新基因。所有的创新都要坚持一个刚性原则,那就是要坚持正确方向导向,坚持走正道,坚持向上向善向美。

 

(一)优质内容和技术创新需双翼齐展

 

内容与技术的融合,要为人民服务。用户在哪里,内容与技术融合的触点就应该在哪里。要密切关注并及时回应公众对网络视听内容的需求变化,借助技术手段提供优质内容。要始终坚持文化价值导向,不能仅满足感官愉悦,更要关注情感教育和社会责任感的传达,确保网络视听内容在高科技包装下依然保留丰富的人文内涵和艺术美感。

 

内容与技术的融合,要深入产业肌理。不应只是舞台上一个高难度的镜头、一个环节上的小小创新,应该贯穿于创意策划、落地执行、数据分析、商业化等全链路,才能影响整个产业结构,才能带来巨大的产业价值和想象空间。

 

内容与技术的融合,还要坚定文化自信。中华文明有着独特的历史脉络、浓厚的文化底蕴,在应用新技术创作生产视听内容时,不能丢失中华文明的灵韵。《千秋诗颂》制作团队在创作过程中,让AI学习了中国各朝代的服饰、建筑、景观,还把384种中国传统色的色彩库以及对应中国的传统节日等加入AI的语料库,将中国审美始终贯穿在数据训练的全过程,为中国动画制作开创了一种全新的创作模式。

 

(二)坚持正确方向导向,防范化解风险挑战

 

在当前不稳定性与不确定性增多的国际环境下,应清醒认识我国网络视听行业在科技创新上面临的挑战和存在的差距,如AI技术在算力、优质数据集、关键设备等方面还存在一定短板。

 

网络视听行业应保持对技术发展趋势的敏锐洞察,加大在关键技术领域的研发投入,支持内部研发团队或与科研机构、高校等合作开展基础研究和应用研发,确保在核心技术上保持竞争力。特别是适时调整人才结构,培养具备跨学科知识背景、跨业务工作的复合型人才。如为适应虚拟制作技术,部分平台设立了“数字影像工程师”的岗位,让开发工程师和算法工程师转型成为掌握在虚拟制作片场能调整灯光、优化场景的既懂技术、又懂艺术的新型人才。

 

网络视听行业应坚持高质量发展和高水平安全良性互动。强化全链条管理,强化数据安全、未成年人保护和隐私保护,完善事前、事中、事后全周期管理,努力形成管理部门、行业组织、市场主体、从业人员各尽其责,协作共担的治理格局。

 

此外,网络视听行业还应积极落实行业政策与发展规划,积极履行社会责任。根据国家、行业管理部门对网络视听的各项政策和指导,把握好技术发展与政策导向的契合点,确保技术应用走在正确的轨道上,推动网络视听在拓展新服务、拉动新消费、增加新就业方面发挥更大的作用。

 

2024年政府工作报告首次提出开展“人工智能+”行动。从此前的“互联网+”到如今的“人工智能+”,“人工智能+”正成为打造新质生产力的重要抓手。AI等技术创新为网络视听带来无限可能,而网络视听的快速发展,同样为全社会带来无限可能。唯有正确把握技术发展方向,坚持创新驱动与规范治理并举,审慎应对技术带来的潜在挑战,才能充分释放网络视听产业的巨大潜力,为其健康发展保驾护航。

 

(作者单位:国家广播电视总局发展研究中心)

图文转载自国家广电智库
编辑/靳唯鸣
责编/张   颖