12月26日,Pika 1.0开启免费公测,普通用户可以直接上手体验。
ChatGPT、Midjourney等AI工具爆火以来,给创作、广告、游戏制作领域带来了十倍甚至几十倍的效率提升已经不是新鲜事。但在视频领域,受制于技术难度和数据集等难题,一直未出现类似文生图以及文本生成的大规模的应用。
一个月前Pika1.0发布,从宣传片上来看,相比此前的AI生成视频产品,Pika1.0在流畅性、画质和风格准确性表现堪称完美,让很多人眼前一亮。
Pika1.0体验起来手感究竟如何,此次,我们直接上手体验了一番。
亮点功能:一键编辑、图生视频、画布延展
进入Pika官网(官网地址:https://pika.art),首页是Pika生成的作品广场,右侧则是用户的个人作品列表。
截图自Pika官网首页
官网最下侧栏目就是提示词入口,可以直接输入提示词和风格类型,也可以上传照片。
在输入提示词之后,还需要选择点击提示词窗口右下侧三个符号,通过调整画面比例,运动强度,输入反向提示词等来功能,让Pika生成的视频更贴合需求。
画面比例上可以根据需求选择想要的尺寸,每秒帧数可以选择默认的24,也可以结合自己需求调整。
选择视频画面比例
Strength of motion指的是运动强度,数字越大,视频中动作变化越快。
选择镜头运动角度
反向提示词是Pika1.0一个独特的功能,输入类似“变形、噪点、质量差、失真、绘制不佳、模糊、颗粒感、分辨率低、饱和度过高、缺乏细节、照明不一致”等提示词,可以优化生成的视频效果。
输入反向提示词
这些设置完成后,就可以在自己的作品列表等待视频。等待过程一般在几十秒或1分钟以上,期间,也可以继续输入提示词创作新视频。
比如,输入提示词“A little girl wearing a red hat is crying in the snowy field,anime style”后,等待了大约10秒钟,Pika制作出了这段视频。
输入提示词“一个带着红色帽子的小女孩在雪地里哭泣”,Pika生成了该视频。
效果不好,也可以选择Retry键,多生成几个视频,再筛选。
Pika最惊艳的是一键编辑功能,用户可以直接选定要调整的区域,输入提示词,编辑视频。
选中编辑前文中生成的视频,输入提示词”戴上墨镜”,就有了下面的效果。
选中视频中小女孩眼睛区域,输入提示词”戴上墨镜”,Pika生成了该视频
除了戴墨镜这种有趣的尝试,Pika的一键编辑和图生视频功能在商业层面将发挥巨大的价值,尤其会给营销广告视频制作领域带来极大的效率提升。
以这张模特图片为例,上传照片给Pika。
图片来自IC photo
静态的图片就转化成一段活灵活现的动态视频,整体效果不错,但视频中的人脸比照片显示更虚一点。
视频由Pika生成
选中视频中模特衣服,输入提示词“给模特穿上牛仔背心”。
选中视频中要编辑的区域,输入提示词
一个换装成功的模特立马出现。
输入提示词”给模特穿上牛仔背心”,Pika生成的视频
如果你觉得只有上半身效果不够,也可以编辑中选择一键扩图。输入提示词“穿着牛仔裤”,选择4:5画布,就可以生成新的模特视频。也可以点击延长4s这个功能,增加视频时长。
选择增加4s,延长视频时长
也有测试失败的作品。同样是上面这张模特图片,我们试图把模特视频转换成3d风格,但效果不如人意。
截图来自Pika
可见,虽然目前Pika1.0宣称支持3D动画、动漫或电影等各种类型内容生成,但在测试中发现,在视频风格转化功能上,Pika产品尚需改进。
Pika的杀手锏:无门槛上手
产品体验上,和各类AI生成视频的工具产品相比,Pika最大的特征就是易用性,可以无门槛上手。
此前,视频类工具都需要掌握一些专业的工具技能才能不断调试,过程复杂,比如Runway提供的Photoshop笔刷和图层等功能对普通用户而言很难上手,更适合专业用户。
但使用Pika的过程中,各类功能简单直接,且二次编辑、画布延展等功能都在产品界面直观看到,对小白用户的上手体验非常友好。
在一次采访中,Pika创始人郭文景曾提到,创立Pika的契机正是发现了AI视频工具的专业门槛过高,对普通人不友好。
2023年年初,郭文景和几位朋友参加了Runway 举办了第一届 AI movie Festival,但在实际制作过程中,他们发现视频工具非常复杂,且使用门槛很高,普通人很难学,即便专业人士,也需要花大量时间用工具反复调试。“比如换个背景,几秒钟的内容要制作几小时,软件还经常crash。”
也是这次经历,郭文景决定创立Pika这个项目。郭文景曾说,AI 的出现,应该让视频制作变得更简单。
同时为了让更多普通人能更高效创作视频,Pika也试图创造更简单的二次编辑体验,过程中,用户只需要输入具体的动作提示词,就能通过简单的标准化动作调试视频。
“一键编辑+图转视频+扩图”,有了这三项能力,视频制作门槛大大降低,甚至未来只需要一张简单的平面照片就成了完成视频的全流程制作,不需要模特去现场。
此前,Pika曾发布一款用Pika Beta 2.0制作的广告短片,该短片翻拍自一支旧广告,原片由30个人耗时一月完成,使用Pika Beta 2.0,仅由一个人,用了不到一天时间,效率提升了几十倍。可见未来,广告制作以及各类营销创意视频使用Pika也将迎来几十倍的效率提升。
随着Pika的爆火,更多普通人开始上手体验新的视频工具,整个文生视频市场也将进一步被打开。
当然,整个AI生成视频领域也还在爬坡阶段,且屡被吐槽宣传片和实际效果不符,虽然Pika 1.0在一些体验上已经有了新的亮点,但在整体的逻辑连贯性、流畅性、画质和风格准确性上,以及复杂逻辑动作尝试上,效果也有限。
比如输入“一个带着红色帽子的小女孩和一只狐狸在雪地里跳舞,anime style”,会发现,Pika并没有生成一只狐狸,而是生成了一个带着狐狸帽子的人。
视频由Pika生成
这也是Runway、Genmo、Imagen Video 等AI视频产品一直面临的一个难点。相比文生图,文生视频本身的技术难度比较复杂,前者考验的是“作图能力”,后者考验的则是作图、理解、逻辑等多重能力。
所以,AI生成视频工具不仅需要掌握基础的自然语言理解能力,还需要在画面流畅度、风格准确性、稳定性、一致性、动作连贯性等方面有较好的表现。
眼下,这个领域还没有一款产品能够像ChatGPT和Midjourney一样,能产出高于用户预期的作品。
谁会是下一个真正在体验上惊艳用户的产品?让我们拭目以待。