颠覆影视行业？Sora能做到吗

【大中小】【打印】

【第1页第2页第3页】

	颠覆影视行业？Sora能做到吗
	http://www.CRNTT.com 2024-02-28 10:13:38

（图源：齐鲁晚报）

　　中评社北京2月28日电／据齐鲁晚报报导，在ChatGPT问世一年多后，OpenAI再度“进化”，日前发布首个AI文字生成视频模型Sora。使用者只需通过文字描述场景，Sora就能生成类似电影的逼真场景，涵盖多个角色、不同类型动作和背景细节等，最高能生成1分钟左右的1080P高清视频，引发业界极大的震撼。Sora的出现被看作“人工智能领域的一次重大突破”，显着提高了AI文字生成视频的能力上限，为今后的文明进步带来更多样的可能性。Sora究竟是什么？未来将给影视行业带来哪些变化与挑战？
效果媲美“大片”

　　近日，由Sora生成的一段时长59秒的视频，在社交网络上广为流传。画面中，一位戴墨镜、身穿红裙皮衣、踩着皮靴的女人，漫步在东京街头，镜头流畅地推到了她的脸部，可以清晰地看到她脸上的雀斑和皮肤纹理。这个一镜到底的视频不需要人来拍摄和剪辑，只要把一段文字描述输入Sora后由AI直接生成。此外，OpenAI还公布了其他几段视频，几只巨大的毛茸茸的猛犸象踏着白雪皑皑的草地走近、一个毛茸茸的小怪物跪在融化的红蜡烛旁边……视频质量媲美“大片”，视觉效果也十分逼真。

　　除了生成的画面高度接近现实物理世界，OpenAI介绍，Sora可以实现视频中的主题始终保持一致，即使暂时离开视野也不会发生变化，并可以一次性生成多机位视频，还可以依靠对语言的深入理解准确地解释提示词，保留角色和视觉风格。有网友感慨，“它将把视频内容带入‘零基础创作’时代”。

　　电影学者李超在接受齐鲁晚报采访时，向记者展示了一段由AI提炼的相关背景介绍：Sora模型的核心是扩散模型，它从“随机噪声”开始，经过上百个细致的处理阶段，最终演化成为一个连贯且生动的视频场景。此外，Sora还结合了语言理解和视觉生成技术，能够创建复杂的场景和角色。“Sora实际上是物理世界通用模拟器。”李超进一步解释说。

　　不少科技从业人员也从不同角度对Sora进行点评。马斯克在社交平台上踊跃发言，“人类愿赌服输”“人类借助AI之力将创造出卓越作品”；AI文生视频创企Runway联合创始人克里斯托瓦尔·巴伦苏埃拉感慨后浪拍前浪，以前需要花费一年的进展，变成了几个月就能实现，又变成了几天、几小时；出门问问创始人李志飞在朋友圈感叹：“LLM（大型语言模型）ChatGPT是虚拟思维世界的模拟器，以LLM为基础的视频生成模型Sora是物理世界的模拟器，物理和虚拟世界都被建模和模拟了，到底什么是现实？”

【第1页第2页第3页】　

【大中小】【打印】扫描二维码访问中评社微信

相关新闻：

Sora恐颠覆影视业　文本转影片场景逼真 (2024-02-22 16:03:43)
国家广电总局新规：不得制造虚假收视收听率 (2020-04-25 11:09:41)
告别天价片酬　让影视行业重回理性　 (2018-09-27 11:15:25)