深度揭秘！OpenAI的Sora会砸掉哪些行业的饭碗？

科技
2024-02-18 10:19:50
0
admcpc198

　　同一天，两个人工智能巨头发布了自己的人工智能新核弹，Open人工智能文学生视频模型Sora再次获得了丰富的色彩。Sora的惊人亮相不仅粉碎了许多人工智能视频同行，而且更有可能改变电影、视频、广告和游戏行业未来的游戏规则。

　　谷歌的新模式性能完全胜利

　　周四，谷歌突然发布了新一代多模态大模型Geminini 1.5 Pro，在与OpenAI的大模型之战中加快超越。这是业内最强的大语言模型，最高可支持1万K Token前后文，直接将性能提升到百万级，在性能上完全秒杀了OpenAIGPT-4 Turbo。

　　百万级Token意味着什么？谷歌AI项目经理杰夫·迪恩（Jeff Dean）解释说，在Gemini中， 1.5 在Pro数百万级前后文本窗口的支持下，用户可以完成复杂的内容交互，轻松分析整本书、电影和播客，了解特别长的文档，甚至数百个文档和数十万行代码库。

　　Gemini 1.5 Pro的发布意味着谷歌在与OpenAI的军备竞赛中具有很强的性能优势。相比之下，OpenAI的发布，GPT-4 Turbo只能处理128kk Token，而且最近出现了性能下降的不利情况，直到上个月发布更新才有所改善。

　　然而，OpenAI并没有让谷歌独树一帜。就在同一天，他们发布了文本生成视频的人工智能模型Sora，只需要文本就可以自动生成视频；继文本模型ChatGPT和图片模型Dall-E之后，OpenAI开始颠覆视频领域。

　　与谷歌Gemininiini相比 1.5 基于数据特性的硬实力优势，Sora基于视觉美学的惊人表现显然更令人印象深刻，并迅速成为社交网站的热点。

　　真假难辨细节惊艳

　　Sora有什么惊喜？OpenAI展示了Sora制作的多个视频内容，仅仅这些片段就足以让人大吃一惊。OpenAI在官方博客中写道，Sora不仅能理解用户的需求，还能知道这些东西在现实世界中是如何存在的。

　　只需输入一段文本，Sora就可以自动生成最长一分钟的超清晰视频。令人难以置信的是，Sora不仅能牢牢把握客户文本中的复杂含义，还能将不同的元素分解成具有特定创意的视频内容，看起来像专业导演、拍摄和编辑的作品。

　　一位戴着墨镜、穿着皮衣的时尚女子走在雨后的东京街道上，嘴角微微翘起，唇彩艳丽。即使戴着墨镜，她也能看到自己的微笑。地上的水反映了她的身影和五颜六色的灯光；热闹的唐人街正在舞龙表演，熙熙攘攘的人群聚焦在跳跃的彩龙身上。整个环境的节日气氛似乎让人身临其境。

　　与之前的人工智能视频有明显的塑料感不同，Sora制作的视频在逼真性和艺术感上有明显的差异：轻微卷曲的角色头发，女性脸上的痣痤疮，地面水反射的霓虹灯，街头小贩卖的许多食物，樱花雪落在天空中，细节的细节几乎很难区分真假。

　　更令人惊讶的是，Sora视频在构图、色彩、创意和镜子运输方面都呈现出明显的电影风格。无论是一面镜子还是多个位置，都可以无缝切换，甚至还有“演员”的表情，这是以前文学生视频产品所没有的。Open人工智能将整个人工智能视频行业提升到了一个更高的水平。

　　虽然Sora制作的视频还没有达到完美的水平，但如果你仔细看，你仍然可以看到“穿帮”，角色吃的饼干甚至会完好无损，但与之前的人工智能视频相比，图像质量有了质的飞跃，甚至有了电影的质感。此外，只有一段抽象的文字才能制作出更多的镜头视频，这种语义理解和镜头应用能力接近人类导演、拍摄和编辑的水平。显然，视频领域的ChatGPT时刻已经到来。

　　令人震惊的AI进化速度令人震惊

　　Sora发布后，网络惊叹不已，几乎抢尽了Gemini的风头。人工智能的进化速度真是令人震惊。要知道，Open人工智能推出ChatGPT，开启生成人工智能时代才14个月。直到去年，我们才熟悉文本生成图片的产品，而仅仅一年前，MidJourney创作的人工智能图片中就会出现六指人物。现在，Sora的视频让每个人都意识到现实和虚拟的界限模糊。

　　尽管OpenAIGPT-4 Turbo之前的性能下降和速度变慢，让人担心生成人工智能的增长遇到了瓶颈；但Sora的发布无疑打消了大家的焦虑。云计算公司Box创始人兼首席执行官列维（Aaron Levie）在Sora发布后，他感慨地说：“如果有人担心人工智能的进化速度会变慢，我们又看到了完全相反的模式。”

　　目前，Sora只对被邀请的创作者和安全专家进行测试，发现和处理可能出现的安全问题，并尚未宣布正式的第一次测试时间表。因为在充满虚假信息的互联网上，DeepFake的道德问题已经成为人们关注的焦点。一旦像Sora这样的假视频被滥用，它可能会造成灾难性的后果。

　　几乎同时，OpenAI也完成了要约售股交易，不是为企业融资，而是允许员工使用Thrive 由Capital牵头的风险投资机构出售当前股权套现。值得一提的是，作为Open人工智能董事会的一员，奥特曼本人并没有公司股票，估值的飙升并没有给他带来巨大的财富。

　　OpenAI整体估值达到800亿美元，比去年年初的300亿美元飙升了两倍多。根据投融资市场研究公司CB 据Insights统计，OpenAI已成为世界上估值最高的初创公司之一，仅次于字节跳动和SpaceX。

　　事实上，这笔交易应该在去年11月完成，仅仅因为奥特曼与股东大会的冲突而被迫搁置。随着奥特曼再次回到OpenAI 在首席执行官职位上，投资者再次向人工智能巨头投票。显然，在Sora正式发布后，Open人工智能的估值将进一步飙升。

　　巨巨头们出手压AGI同行

　　那么，令人惊叹的文本生视频Sora到底会带来什么影响呢？

　　AGI视频同行无疑是最直接的影响。Sora发布后，AI视频创业公司Runway 首席执行官瓦伦祖拉（Cristóbal Valenzuela）在X平台(之前的推特)上简单发布了两个字，“Game On．“(竞争开始了)。几个月前，Runway刚刚发布了Gen-2视频模型。另一家AI视频公司StabilityCEO莫斯塔克（Emad Mostaque）直接叹了口气，“奥特曼真是个魔术师。”

　　Runway成立五年，在人工智能视频领域占据先发优势，已被好莱坞主流片场使用。去年获得七项奥斯卡奖的年度电影《瞬息全宇宙》使用Runway制作人工智能视频。在《瞬息全宇宙》取得巨大成功后，Runway的新一轮融资估值也上升，达到15亿美元，是一年前估值的三倍。

　　文学生视频领域是目前最热门的创业领域。在过去的几个月里，随着生成人工智能的热潮，许多初创公司也出现了文学生视频和图片生视频。A16z人工智能投资合作伙伴摩尔（Justin Moore）列出了他跟踪的20多个文生视频创业团队，其中包括Pika、Zeroscope这样一度引起网络惊叹的创业新贵。

　　去年年底，斯坦福中国毕业生创立的Pika视频曾在中美互联网上引起惊喜。由于人工智能视频的惊人表现，这家只有四人的初创公司在不到半年的时间里完成了超过5500万美元的三轮融资，估值飙升至2.5亿美元。

　　但现在，人工智能巨头Open人工智能已经直接抛出了Sora。无论是视频持续时间、图片细节、细节完整性，还是多镜头拍摄，Sora都远远超过了这些小初创公司的视频，并不过分。虽然人工智能视频领域仍有巨大的改进和增长空间，但这些小公司未来是否有能力与Open人工智能竞争仍是一个大问题。

　　上下好莱坞劳资谈判

　　然而，Sora不仅会影响其他AGI视频初创公司的生存空间，还会改变整个好莱坞、电影、电视、广告和游戏行业未来的游戏规则。

　　好莱坞用人工智能制作图片和视频并不是什么新鲜事，从CG(电脑动画)开始、VR到AI，影视娱乐业一直是高科技的首选。然而，与其他技术不同，人工智能工具一直是好莱坞从业者心中的一根刺。

　　除了使用Runway的人工智能视频工具外，福克斯还与IBM沃森合作，使用人工智能工具制作关于人工智能主题的恐怖电影《摩根》的预告片；迪士尼的惊奇漫画完全使用人工智能设计了《秘密入侵》的开头动画。

　　当时是好莱坞演员和编剧工会罢工的时候。生成人工智能在影视行业的应用也是双方争议的焦点之一。在谈判过程中，演员和编剧得知迪士尼漫威新一季的《秘密入侵》已经完全利用人工智能技术创造了开幕式。这一消息再次搁浅了双方的谈判。

　　为什么影视行业使用人工智能工具会引起这么多争议？业内人士主要担心制片人使用当前材料进行人工智能培训，未来经常使用人工智能工具生成内容，不仅侵犯了创作者现有作品的版权，没有给他们足够的收入，而且影响了创作者未来的工作机会和空间。

　　尽管去年，编剧和演员们毫不犹豫地暂停了这个行业，以换取制片人的暂时妥协，并为人工智能工具的使用制定了更多的规范。但在三年后的下一次劳动力谈判中，演员和编剧可能会面临更困难的情况，因为人工智能的性能必须大大提升。

　　电影电视Tiktok

　　随着文学视频模型Sora的惊人亮相，也许整个好莱坞从业者都面临着一个巨大的问题：根据人工智能的指数进化速度，人工智能可以生成一个完整的情节短片甚至电影，从剧本到拍摄到表演到后期，那么好莱坞的未来会是什么样子呢？

　　好莱坞导演戴夫·克拉克拍摄了恐怖电影《当她醒来》（Dave Clark）已经在使用人工智能工具制作电影了。在他看来，Sora和其他人工智能技术并没有带来威胁，创造者需要拥抱人工智能技术来创造以前难以实现或想象的内容。“这是一种改变游戏规则的技术。你不应该担心你的工作，而应该担心谁在使用这些工具。”

　　CVL是行业调查企业 Economics上个月对300位好莱坞行业领袖的一项调查显示，整个好莱坞都充满了担忧。36%的受访者表示，生成人工智能降低了他们公司的日常工作能力需求，72%的受访者是生成人工智能工具的最早用户。

　　更残酷的现实是，75%的受访者承认，生成人工智能（工具、软件和模型）促使他们的业务部门削减和合并职位。这些控制好莱坞行业秩序的人估计，未来三年，好莱坞将有超过20万个职位受到人工智能的影响，尤其是视觉效果、音效工程师、绘图工程师等后期职位。

　　影片《Shovel Buddies》编剧海勒曼（Jason Hellerman）我认为，随着人工智能工具的逐步改进，制片人当然可以通过Sora等工具生成视频，而不再需要支付制作团队。人工智能生成的内容也可以创建一种新的类型，但如果每个人都能使用人工智能制作视频和电影，成为一个“内容创作者”，这将不可避免地导致专业水平的下降。

　　他预测，将来每个人都可以生成自己的视频，就像现在每个人都在手机上拍摄和观看Tiktok短视频一样。习惯了短视频的Z一代年轻人，将来会逐渐放弃福利资源这么长的内容。也许在人工智能生成视频的未来，福利资源将成为像Tiktok短视频这样的形式。

上一篇：Reddit达成数据授权协议，每年6000万美元引领AI新风潮！
下一篇：苹果Vision Pro激发Meta开启头显界新篇章！