|
(图源:齐鲁晚报) |
中评社北京2月28日电/据齐鲁晚报报导,在ChatGPT问世一年多后,OpenAI再度“进化”,日前发布首个AI文字生成视频模型Sora。使用者只需通过文字描述场景,Sora就能生成类似电影的逼真场景,涵盖多个角色、不同类型动作和背景细节等,最高能生成1分钟左右的1080P高清视频,引发业界极大的震撼。Sora的出现被看作“人工智能领域的一次重大突破”,显着提高了AI文字生成视频的能力上限,为今后的文明进步带来更多样的可能性。Sora究竟是什么?未来将给影视行业带来哪些变化与挑战?
效果媲美“大片”
近日,由Sora生成的一段时长59秒的视频,在社交网络上广为流传。画面中,一位戴墨镜、身穿红裙皮衣、踩着皮靴的女人,漫步在东京街头,镜头流畅地推到了她的脸部,可以清晰地看到她脸上的雀斑和皮肤纹理。这个一镜到底的视频不需要人来拍摄和剪辑,只要把一段文字描述输入Sora后由AI直接生成。此外,OpenAI还公布了其他几段视频,几只巨大的毛茸茸的猛犸象踏着白雪皑皑的草地走近、一个毛茸茸的小怪物跪在融化的红蜡烛旁边……视频质量媲美“大片”,视觉效果也十分逼真。
除了生成的画面高度接近现实物理世界,OpenAI介绍,Sora可以实现视频中的主题始终保持一致,即使暂时离开视野也不会发生变化,并可以一次性生成多机位视频,还可以依靠对语言的深入理解准确地解释提示词,保留角色和视觉风格。有网友感慨,“它将把视频内容带入‘零基础创作’时代”。
电影学者李超在接受齐鲁晚报采访时,向记者展示了一段由AI提炼的相关背景介绍:Sora模型的核心是扩散模型,它从“随机噪声”开始,经过上百个细致的处理阶段,最终演化成为一个连贯且生动的视频场景。此外,Sora还结合了语言理解和视觉生成技术,能够创建复杂的场景和角色。“Sora实际上是物理世界通用模拟器。”李超进一步解释说。
不少科技从业人员也从不同角度对Sora进行点评。马斯克在社交平台上踊跃发言,“人类愿赌服输”“人类借助AI之力将创造出卓越作品”;AI文生视频创企Runway联合创始人克里斯托瓦尔·巴伦苏埃拉感慨后浪拍前浪,以前需要花费一年的进展,变成了几个月就能实现,又变成了几天、几小时;出门问问创始人李志飞在朋友圈感叹:“LLM(大型语言模型)ChatGPT是虚拟思维世界的模拟器,以LLM为基础的视频生成模型Sora是物理世界的模拟器,物理和虚拟世界都被建模和模拟了,到底什么是现实?”
|