AIGC在过去的2023年中,其每一步发展都备受数字行业相关从业人员的关注,多模态交互是其发展的必然趋势,具体到短视频领域,它怎样看懂视频,又将如何赋能,在AI的加持下短视频产业将走向哪里?
在日前召开的第四届中国短视频大会“主流媒体短视频创新传播”分论坛上,中央广播电视总台创新发展研究中心新媒体研究部主任黎斌,带来了《AI技术重塑短视频市场的八大趋势》为题的主旨发言。
以下内容根据黎斌先生的发言实录整理:
图注:中央广播电视总台创新发展研究中心新媒体研究部主任 黎斌
01「 “AI+视频”的技术逻辑概览」
1、AI如何解析视频 (看懂视频)
AI视频分析引擎对原始视频进行结构化信息抽取,从中解析“对象”“属性”“行为”“事件”。
视频结构化是一种利用深度学习技术对视频进行逐帧分析,对视频内容进行对象识别、特征提取,以智能标签形式保存成结构化数据(能与每帧关联起来),建立视频大数据结构化平台,成为后期视频智能检索和视频数据挖掘的基础。
图片来源:知乎@阿里云视频云
从视频标签的流程图中可以看到,输入一个视频,分别进行两部分操作:
- 一部分是对视频做抽帧处理,抽帧得到的图像通过人像识别、场景识别、物体识别、地标识别、OCR等图像AI识别模型,提炼出视频标签。
- 另一部分是把视频中的音频提取出来,然后通过ASR(自动语音识别技术)得到文本结果,最后再经过NLP(自然语言处理),提取出文本标签。
2、AI“看懂”视频后的赋能空间
AI看懂视频并赋能的逻辑为:AI解析视频-特征识别—>元素抽取-重新组合
1>基本能力
在AI技术的支持下,短视频编辑软件可以自动识别出视频素材中的人物、场景、物体等要素,并根据需求进行智能分割、分类和标注,这使得编辑人员可以更加方便地搜索、整理、使用各种素材,极大减少了人力物力的浪费,提高了工作效率。
图片来源:作者自制
2>AI视频合成
AI 视频合成技术能够从多源视频中提取元素,例如人物、场景、特效等,通过智能算法,快速剪辑和合成视频,添加过渡效果、音乐和文字,节省了大量的时间和精力。
3>AI 视频自动化生成
“视频生成”是指通过对人工智能的训练,使其能够根据给定的文本、图像、视频等单模态或多模态数据,自动生成符合描述的、高保真的视频内容。AI 视频生成工具就如同你的视频制作室,让你能够利用自己的图片、文字或视频素材来打造独特的影片。
AI视频生成的基本方法:关键帧 + 补间技术三步骤。
先通过各种AI生成图片的方式生成静态关键帧图像,通过生成视频关键帧形成视频的“粗略”故事情节;然后通过AI补帧算法,平滑关键帧之间的连接细节,依次填充附近帧之间的内容;最后再通过协同补帧算法,弥补关键帧生成可能存在的各类缺陷,提升生成视频的整体质量和连贯性。
因AI视频解析技术带来了AI对视频元素具有的多种重构与合成能力,从而重塑了传统视听媒体采、编、审、发等生产全链条的工作模式,乃至直接生成视频的AI大模型的出现,将全面赋能视听内容产能。
02「 AI加持下短视频市场的八大趋势」
在2023这个被称为“AI 元年”的特殊年度,继 GhatGPT 腾空出世之后,开启了全球的“百模大战”。2024已踏浪而来,视频创作不再局限于传统的方式了, 基于AIGC的迅猛发展,今后短视频市场将呈现值得关注的八大趋势:
趋势一、视频井喷,注意力竞争更加激烈
1、大大减少实景拍摄,降本增效
短视频创作者通过AI技术可以更快速地完成剪辑、调色、特效等编辑工作,从而降低制作成本,提高创作效率。
除了更多抽象和虚幻的视频片段用AI制作各种教育课件、专题片、科幻电影外,还有许多以前需要实地拍摄、现场演示的视频也会用到AI取代,如手把手食谱视频,现在做视频时不用浪费食物了。
2、随着多模态技术的快速成长,还将迎来进一步的视频内容大爆炸
近年来,自动音频播放作为网络阅读的另一种选择开始兴起。合成视频工具很快也能做到这一点,通过AI技术可以将文本、图片、音频等多种媒体形式转化为视频,实现自动化的视频创作,蕴藏巨大的应用场景!
我们将会看到:
- 很多作者将自动为每一篇博文和文章创建视频版本,会成为一种时髦,企业、品牌文宣也纷纷将他们所有的内容转换成视频形式。
- 尤其是AI自动剪辑短视频工具的出现,仅存量长视频的短视频再传播,就会带来巨量降本增效价值!
- 搜索将升级。想象一下,你遇到一个新的主题,想要为其创建内容。这样,我们可能会看到完全基于搜索查询而创建的个性化定制视频。目前谷歌每天有 85 亿次搜索量,百度日均60亿次搜索,其中有多少会在未来变成视频?
趋势二:AI视频化的生产与应用更加大众化
随着智能硬件的不断发展,AI技术将成为智能手机、智能相机等设备的标配。这将进一步提升用户在短视频创作中使用AI技术的便捷性和实用性。多模态支持自然语言交互修改图像和视频,技术操作简化,降低使用门槛。做到提速增效,快速反馈。
趋势三:AI改变创作者的游戏规则:让视频剪辑升级为导演
- AI辅助视频创作场景,合成素材创意:想象一下,你可以描述自己正在寻找的精确片段(甚至提供相机移动方式、角度、光圈),然后,AI 会直接在你的编辑程序中创建无数的选项,直到你找到完美的素材。
- 视频修改创意:想象一下,你是品牌方,一年前拍摄了一个很好看的视频,但后来更新了包装。现在用AI,你将能够快速和经济地以新换旧,而不需要重新拍摄,或聘请昂贵的视觉特效人员。有了AI视频生成工具之后,你将不仅可以擦除视频场景的一部分,还可以创造新的内容来替换它。
- AI工具能够从手机镜头中建立即时的布景和背景:这类虚拟制作,不需要大量的工作人员、仓库布景或 LED 墙,从而节省了大量成本,但需要你提出设计。
以上单独的工具应用将改变创作游戏规则,但它们主要还是用于改进现有的内容,人们手动将合成片段剪辑成一个有叙事表达的作品。但这一阶段将是短暂的,因为人工智能将能够把这一过程自动化。
AI在不远的将来能支持实时视频生成。通过AIGC,只需简单的脚本或场景描述,系统就能自动生成精美的视频内容。 这将通过将视频/音频模型与大型语言模型相结合来实现,形成所谓的多模态模型。这一技术基本上是把 ChatGPT 和视频结合起来了。
一旦你向它提出一个视频的想法,并提供一些标准,它将会:
图片来源:作者自制
以上创作场景下均产生新的编辑范式:AI 工具改进现有视频工作流,改变视频创作者的游戏规则,特别是传统的视频剪辑将上升为一个“艺术+技术”复合要求的富有策划力、创造力的导演!
趋势四:内容质量竞争中AI成为必杀技
未来,用户将更加追求高质量的短视频内容,而平台也将更加注重内容的制作和筛选。
AI 工具释放创造力:AI支持创造更广泛的内容,AI 大模型可以分析大量的短视频数据,提取其中的创意元素和流行趋势。这将为创作者提供更多的创意启发和创作方向。并进一步普及创建专业内容的能力。
AI 大模型推动短视频行业变革:新人更容易进入视频创作领域,创作速度更快,更经济;带来内容创作、个性化推荐、内容审核、广告投放等方面的变革,推动行业的发展和创新。因此短视频行业AI成为必杀技!
AIGC是降低还是提高了内容创作工作者的职业门槛?
从创作本身来讲,门槛是降低了,但从创作的目标来讲,AIGC其实是提升了创作职业的从业门槛。因为人人都可以写和画了,内容将变得极大丰富。但人的注意力总是有限的,所以,如何创作出有创意的内容变得更加重要了。
趋势五:短视频IP进化,AI 数字人将成为标配
1、短视频IP:网络帐号→人格体
AI 大模型可以用于创建虚拟主播和互动内容,与用户进行实时互动。这将为短视频行业带来新的互动体验和商业模式。
图片来源:作者自制
2、AI助推“虚拟网红”的蓬勃发展
AI虚拟网红可以逼真地模拟真人,解放真人时间,增强用户互动,将在各个领域释放它们的创造性和影响力, 随着生成式AI视频工具将这一过程普及化,那么自媒体、产品品牌都会建立自己的虚拟形象。这将重塑整个网红领域。
图片来源:Virtual Humans
3、数字分身让越来越多的内容具有互动性
现在人人都可以为自己的数字分身创造内容,给他们的虚拟躯壳赋予内容的“灵魂”,甚至看起来可以以我们自己的个性与他人互动交流。
如何将“自己”移植到数字空间?即微调(fine-tuning)。 利用了现有基础模型的强大功能,然后继续在更小、更具体的数据集上训练这个模型。
数据从何而来?它会抓取你的电子邮件和社交媒体帖子。对于 youtube 、抖音用户来说,这还可能包括他们多年来上传的数千小时的视频。
这种方法的文本版本已经存在,最近推出的一个网站 character.ai,利用微调技术创建了“名人聊天机器人”。通过这个工具,你可以和拜登总统或者爱因斯坦交谈。
提高内容粘性靠什么?今后越来越多的内容将是互动性的,靠沉浸式互动体验,靠与虚拟数字人的情感互动、个性化交往、知识互动和文化交流,正将社交方式重新定义。
下一步,大模型进一步落地,智能体工具(AI.Agent、GPTS)作为个人智能助理将进一步提速短视频产业升级:
- 从供给侧看,生产短视频正从人工操作—>AI辅助—>AI Agent代工,现在一个制作团队1000人,其生产力可能赶不上一个团队4人却拥有50个智能体的生产力;
- 从消费侧看,AI虚拟数字人更加逼真拟人化,这种内容社交提升了内容粘性,内容消费从静态观看升级为沉浸式互动,进一步向用户个性化、千人千面的AI助理进化。比如,你的母婴短视频IP可能成为众多母亲婴儿护理的7*24小时在线的指导专家。
趋势六:视频信息更多定制化和个性化
AI大模型加持下,短视频内容井喷必然促使个性化消费升级:AI 大模型可以更好地理解用户的兴趣和偏好,从而提供更加个性化的短视频推荐。这将提高用户的观看体验,增加用户粘性。
同时,AI技术能够创造出更加个性化的内容。通过使用AI 技术,创意设计师可以根据不同的受众特点和需求,为他们提供定制化的体验。用户也将能够根据自己的兴趣和喜好,定制自己的短视频内容,而平台也将根据用户的需求,推送更加个性化的短视频内容。
趋势七:AI视频生成竞争将进一步挑战传统媒体机构的创作优势
随着技术的进一步发展,AI 视频技术深刻改变媒体市场格局。有了AIGC的助力,视频制作已经不再局限于专业人士,每个人都能成为自己的导演,传统广电媒体依靠重装备、高技术门槛形成的创作优势逐渐消失,每一个人使用AI都可以展现出属于自己的独特风采,更多精彩短视频、微电影和游戏作品,将不再出于传统机构之手,传统媒体面临降本增效的市场压力骤增。争夺大众注意力的竞争更加白热化,目前能够带来可持续广告收入的品牌浏览量/参与度会全面下降。
图注:2021-2025年中国AI视频生成行业市场规模及增速。 来源:共研产业咨询(共研网)。
中国AI视频生成行业竞争格局较为集中,由几家同时具备AIGC技术开发平台和视频平台的互联网巨头主导。我国市场领先的企业为百度、阿里、腾讯以及爱奇艺。从中国AI视频生成行业竞争趋势层面来看,互联网巨头凭借其强大的研发实力、产业链布局以及庞大的用户基础,铸就了一道难以逾越的市场优势壁垒。
趋势八:AI短视频领域面临巨大的造假侵权风险
当前,深度合成技术除了单一的图像、音频合成之外,它以真实的镜头为基础进行训练,你可以加入任何想要加入的脚本,这样可以将语音识别、人脸识别、唇形搜索等结合起来,进行人脸语音的合成,训练并克隆某人声音,把声音和图像结合起来,从而可以让这个人自然流利地说出自己从未说过的话。
现在谷歌的语音人工智能已经可以通过图灵测试。 人工智能领域的专家们表示,不久之后就会很难知道一张照片、一段视频或一段音频是否是真实的。
如何防范AI风险?
1、从技术角度,要以魔法打败魔法,为了避免深层造假,Runway 表示它正在使用人工智能和人工审核的组合,防止用户产出包括色情或暴力内容或违反版权的视频。AI 大模型可以辅助内容审核,帮助平台快速识别和处理违规内容。这将提高平台的内容质量,保护用户的合法权益。
2、另一方面,是加强法律监管。我国对生成合成类内容等提出了系列监管要求。2023年1月10日起实施的《互联网信息服务深度合成管理规定》进一步提出,深度合成服务提供者深度合成服务时,应当使用显著方式对深度合成信息内容进行标识。
总之,AI是一场提升生产力的革命! 相比而言,互联网是一场生产关系的革命、通过改善资源的配置方式而提升生产效率。它是通过去中介化来提高效率,远不及AIGC的效率革命。
你希望在短时间内画一百张画,通过互联网的众包的方式,你让一百人同时写,可以提升效率;但不如用Midjourney工具来画,从成本、效率乃至质量都有天壤之别!这是不同层次生产力的差异!如同工业革命时期火车相比于马车这种生产力的提升,我们可以说AIGC所带来的技术革命甚至能够超过互联网和移动互联网带来的变革。英伟达黄仁勋说:人工智能“不同于以往的任何技术”,因为智能是“所有其他技术的基础”——人类正是因为拥有智力才能发明出各种技术。他预言两年之内英伟达乃至整个行业也会“面目全非”。
短视频的列车已经驶入AI时代了, 让我们觉知当下,整装待发吧!
本文来自微信公众号“德外5号”(ID:dewaiwuhao),作者:黎斌