丰色 萧箫 发自 凹非寺量子位 | 公众号 QbitAI
斯坦福华东谈主博士休学搞创业,径直火爆AI圈!
新址品对准AI视频生成,刚出谈就成行业顶流,引来一众大佬围不雅评价。

OpenAI大牛Andrej Karpathy转发,并情谊附上长文一段:
今天足球比赛,您皇冠押注。每个东谈主皆能成为多模态梦幻的导演,就像《盗梦空间》里的筑梦师一样。

就连Stability AI独创东谈主也来点赞:

这个新址品名为Pika 1.0,背后公司Pika于本年4月开导。
这中国体育彩票
要知谈,这一转的居品已有不少,如开导5年的Runway等公司。
在AI视频生成“乱花迷东谈主眼”确当下,这个新址品究竟是怎样作念到赶紧破圈,眩惑大批存眷度的?
从放出的Demo后果来看,Pika 1.0不仅能证据翰墨图片,怒放地生成一段视频,动静调度就在刹那间:

而况可裁剪性还绝顶强,指定视频中的轻易元素,一句话就能杀青快速“换装”:

这样的后果,也使得公司开导仅半年,居品用户照旧高出52万东谈主。

更是新斩获5500万好意思元融资,其中个东谈主投资者不乏各类大牛,如Quara独创东谈主Adam D’Angelo、Perplexity的CEO Aravind Srinivas、GitHub前CEO Nat Friedman等等。
是以,Pika究竟有莫得看起来这样好用?咱们也坐窝上手体验了一番。
AI视频新顶流长啥样?
这次火爆出圈的Pika 1.0,是Pika发布的第一个郑再版块居品。
流程四个多月Discord社区的测试,Pika以为是时候推出本次要紧升级了。
比较之前Pika还只可用翰墨或图像生成视频,如今的Pika 1.0,功能要愈加丰富——
不仅能证据翰墨、图片或视频格调生成视频,还能对视频局部进行裁剪。

可裁剪性有多强?
不仅画面大小轻易扩展,从5:2、1:1画布,到9:16以及16:9的超大屏,4种聘请无缝调度:

像什么3D、动漫、电影等多样各样的格调滤镜,那就更毋庸说了。

最进攻的是,1.0郑再版推出了用户更友好的网页版,毋庸在discord中一遍遍艾特机器东谈主,就能径直上手玩。
(不外,当今它还需要列队,需重心耐性。)

虽然,也可以移步Discord社区先上手体验一番。

尽管它还未随网页版更新到Pika 1.0,但咱们也实测了一下翰墨、图片生成视频的后果,还可以。
加入社区之后,直奔“Creations”,从底下的10个生成区璷黫聘请一个参加即可开耍。

在输入框中输出“/”,聘请最通俗的“/create”敕令:
人工智能
在此,咱们输入“a robot dancing in the rain, sunset, 4k, -gs 8”教唆词交给机器东谈主。
约略也就半分钟的时候,视频就出来了,速率额外快:
真人博彩平台推广
后果嘛,雨莫得证据得很显然,但机器东谈主的肢体动态性真实很强。
咱们再来一个稍稍长一些的教唆词:
a teenager walks through the city streets,takes pictures of places(一个青少年穿过城市的街谈,拍摄相片)
仍然超等快,截至就出来了:

Wow,这次真实有很纷扰,画面安妥脑海中的展望,致使比咱们念念象得还要好。
除了纯翰墨,咱还可以上传一张参考图像进行创作,使用“/animate”敕令。
皇冠体育博彩
当当,一张静态面孔包就动起来了:

总的来看,Pika给出的视频时长皆是3s(是以使用太长的教唆词也没用,后头会径直忽略掉),以及它还不可保证每次截至皆很纷扰,但总体来说多试几次照旧有可以的截至出现的。
在自测除外,咱们也来望望网友的作品,其中不乏相称惊艳的后果。
比如有东谈主创作的这只小怪兽,憨态可掬,让东谈主忍不住念念摸一把:

还有这段两位小女孩的演奏画面,看完我好像真实听到了优好意思的嗓音从中传出:

最绝的照旧这个白鸽围绕短发好意思女翻飞的形势:

也太有氛围感了吧~
看罢如上后果,咱们也来盘盘这家公司究竟是什么来头。
两位斯坦福华东谈主博士创立
Pika的独创东谈主一共有两位,郭文景(Demi Guo)和Chenlin Meng,皆是斯坦福博士。

据The Information音问,郭文景于本年四月创立了Pika,随后Chenlin Meng加入成为联创,两东谈主和洽开发了这个文本生成视频模子。
从二东谈主学术阅历来看,她们分歧专注于NLP和狡计机视觉两个标的的AI探讨,也皆有生成式AI的学术阅历。

聚始独创东谈主兼CEO郭文景,斯坦福大学AI现实室(NLP&图形学标的)博士。
她在好意思国建设,杭州长大,初中就读的是杭州番邦语学校,从小就宣战编程,夺得过IOI银牌,从本科初始负责留学,被哈佛大学提前登科。
这次创业,她的领英主页知道休学中(On Leave),应该是蓄意先忙创业的事情。

在斯坦佛大学读博之前,郭文景在哈佛大学取得了狡计机硕士和数学本科学位。
在本科时期,她也曾gap过一年,专程在Facebook AI Research全职作念了一段时辰的探讨工程师。
在任时期,她参与了用Transformer分析2.5亿个卵白质序列的探讨,目前这篇论文援用已有1200+,其中就包括其后大火的AlphaFold2:

除此除外,她也先后在Epic Games、谷歌和微软等多家公司实习过。
这次创业,郭文景的导师Christopher D Manning也予以了不少支撑。
Christopher D Manning以NLP标的的探讨知名,如今在谷歌学术上的援用量已有23w+,而他也将成为Pika的学术守护人之一。

聚始独创东谈主兼CTOChenlin Meng,相似是斯坦福狡计机博士。

在此之前,她于2020年在斯坦福大学获取了数学本科学位。
比较郭文景在NLP界限的探讨告诫,她在狡计机视觉、3D视觉方面的学术阅历愈加丰富,参与的去噪扩散隐式模子(DDIM)论文,如今单篇援用已有1700+:

除此除外,她还有多篇生成式AI干系探讨发表在ICLR、NeurIPS、CVPR、ICML等顶会上,且多篇入选Oral。

虽然,跟着Pika 1.0爆火,Pika也开启了进一步的招东谈主筹划,从工夫、居品到运营皆有需求:
iba娱乐直营网
一个月内5家居品亮相
值得一提的是,不啻是正在快速膨大的Pika。
就AI视频这个行业而言,这段时辰来合座皆迎来了一段“爆发期”。
据不透彻统计,从11月于今,短短一个月的时辰就照旧有5家AI视频生成居品发布或迎来大更新:
皇冠客服飞机:@seo3687领先即是11月3日,Runway的Gen-2发布里程碑式更新,支撑4K超传神的明晰度作品。

然后时辰来到11月16日,Meta发布Emu Video,这个器具在用户评估中堪称击败Gen-2、Pika等敌手,后果be like:

从Emu初始,全球皆好像打起比赛来了,那叫一个不甘人后。
才过两天,11月18日,字节就中途杀开拔布PixelDance,作品的动态性可谓史无前者,画面中的元素皆手脚幅度皆额外大,且不变形,让东谈主目下一亮。

又仅过3天之后,11月21日,AIGC界限的杰出人物Stable AI也终于推出了自家的视频器具:Stable Video Diffusion。
前段时间杭州还公布了亚运会美食,东坡肉、宋嫂鱼羹、清炒虾仁、京葱爆牛肉、蒜香肋排、小炒肉等等。
皇冠体育
后果嘛,也很能打。
统一天,Gen-2又没闲着,“横插一脚”上线“涂哪动哪”的运下笔刷新功能,径直象征建设成模子可控性上的一个进攻里程碑。

临了,即是今天了,11月29日,来自创业公司的Pika径直带着网页版发布郑再版1.0,叫板“老老迈”Runway。
在此除外,咱们还从未见过哪个阶段有这样多各有性情、来自不同布景的居品争相亮相。
这也让东谈主不得不惊叹一句:
AI视频这是来到爆发前夕了?
接待大伙各握己见~
参考运动:[1]https://twitter.com/demi_guo_/status/1729546758718656530[2]https://pika.art/blog[3]https://twitter.com/mignano/status/1729510740246020403
