Sora生成的视频截图
近日,OpenAI推出的视频生成模型"Sora"引起了全球瞩目。与以往仅能生成几秒钟视频的模型不同,Sora将视频长度一举拉长至60秒,并且在生成视频时能够理解用户的提示,并呈现出物理世界中的存在方式。这个全新模型的推出,引发了业界人士的探讨,Sora到底懂不懂物理世界?
Sora的超越之处
视频长度和一致性
Sora不仅能够根据文字指令创造逼真且富有想象力的场景,还能生成长达1分钟的一镜到底的视频。在视频中,人物、背景等各种元素都保持了惊人的一致性,展现了高度的技术突破。
多镜头的创新
Sora的多镜头设计使其在生成视频时远远超越了之前的AI模型。相较于单一镜头生成的视频,Sora能够在多角度之间切换,保持高度一致的人物、背景和风格,让观众感受到更为真实和引人入胜的观影体验。
Sora的潜在能力
对物理世界的理解
一些专业人士认为,Sora的强大之处可能不仅仅是生成视频,还可能涉及对物理世界的理解。Sora能够根据提示词理解人、物在物理世界中的存在方式,呈现出对物理世界的模拟。
数据驱动的物理引擎
Jim Fan,英伟达高级研究科学家,认为"Sora 是一个数据驱动的物理引擎",并称其为"一个可学习的模拟器,或『世界模型』"。这一观点表明Sora可能不仅仅是一个视频生成模型,更可能是一个理解和模拟物理世界的引擎。
争议与不同观点
然而,对于Sora是否真正理解物理世界,技术界存在不同观点。杨立昆,图灵奖得主,Meta公司首席科学家,对Sora的理解持怀疑态度。他认为,仅仅通过提示词生成逼真视频并不能代表模型理解了物理世界,这与基于世界模型的因果预测过程完全不同。
尽管存在不同的观点和争议,业内普遍认为Sora的出现将具有颠覆性的意义,标志着一次新的技术变革。然而,Sora模型的实际影响力何时爆发,仍然是一个难以预测的问题,需要进一步的观察和研究。无论如何,Sora为AI生成视频领域带来了前所未有的可能性,挑战着我们对于人工智能能力的认知。
免责声明:本页面旨在为广大用户提供更多信息的无偿服务;不声明或保证所提供信息的准确性和完整性。本站内所有内容亦不表明本网站之观点或意见,仅供参考和借鉴,购房者在购房时仍需慎重考虑。购房者参考本站信息,进行房屋交易所造成的任何后果与本网站无关,当政府司法机关依照法定程序要求本网站披露个人资料时,我们将根据执法单位之要求或为公共安全之目的提供个人资料。在此情况下之任何披露,本网站均得免责。本页面所提到房屋面积如无特别标示,均指建筑面积。 注:本站所有信息未经许可,不得转载,复制,抓取等,如有违者必追究法律责任。如有异议可投诉至:Email:133 46734 45@qq.com