Sora能否颠覆LED虚拟拍摄?行业龙头这么看
发布时间:2024-02-24 23:33:23

  新锐OpenAI推出的Sora火爆全球,不仅显著提升了AI在视频生成领域的表现和应用潜能,传统影视和多媒体创作流程也被认为面临颠覆式影响。

  洲明科技(300232)作为A股LED虚拟拍摄头部上市公司,已经提出了+AI战略。日前,集团内容创意执行总裁、副总裁刘俊在接受证券时报·e公司记者专访时表示,剖析了Sora相较过往视频生成模型的关键突破点,并表示一旦Sora对外开放接口,有望第一时间使用到全球最先进的视频生成技术。他还预计,伴随Sora类应用降低专业门槛以及屏幕成本降低,虚拟拍摄将从当前工业级市场拓展到广阔的企业级和消费级市场。

  虽然文生视频并非应用,但Sora在模拟能力突出。刘俊指出, Sora不仅模拟动态的视觉效果,还能捕捉到更深层次的,与日常生活经验一致的互动模式。据介绍,模拟要体现在3D一致性、长期一致性、世界交互模拟三个方向。

  “尽管在处理复杂的物理交互和长时间一致性上仍存在挑战,但Sora在模拟简单世界互动方面已经展现出了显著的能力,为未来AI技术的发展开辟了新的路径,特别是在理解和模拟真实世界动态这一领域。”刘俊表示。

  在语言理解与视频生成方面,Sora利用先进的文本解析技术,能够准确理解用户的文本指令,并给予指令生成富含细节和情感色彩的角色,以及生动的场景。除了文本提示外,Sora还能够接受静态图像或已有视频作为输入,进行内容延伸、填充缺失帧以及风格转换等操作。

  另外,Sora可支持多样化视频格式和更长的视频,无论是宽屏的1920x1080p视频、垂直的1080x1920视频,Sora都能够应对自如,视频长度达一分钟。

  “Sora还改进了视频构图和框架,即便宽屏格式的视频也可以确保主要内容始终处于观众视线中,而不会像某些模型那样,只显示主题的一部分。” 刘俊表示,这提高了生成视频的视觉质量,也改善了观看体验。

  “多模态将是2024年AI大模型领域最主要的边际变化。” 刘俊向记者表示,从ChatGPT 4.0到Sora,生成式在从大语言模型向多模态模型演,这背后离不开算力和数据支持。作为数据驱动的物理引擎,Sora模型同样需要大量算力和数据支持。

  “OpenAI的创始人Sam Altman计划全球融资7万亿美元以投入AI芯片领域,这就表明算力的发展还会有很长的发展历程。” 刘俊也指出,所有AI问题本质是数据空间的问题,但数据是没有穷尽的,人类发展史所创造的数据还有很多等待挖掘,这是目前AI还未触达的数据范围,还有很长一段路去发展。

  不过,考虑算力禁售问题、研发投入、技术储备和人才等因素,刘俊认为,中国版的Sora具体可实现效果还是值得期待的。

  Sora作为一款高度先进的AI视频生成模型,影视制作与视频剪辑行业被普遍认为是领先的。但刘俊向记者表示:“按照Sora现有技术,可以提高虚拟拍摄的效率,但短期内难以替代真人表演的效果。”

  LED虚拟拍摄利用大面积的高分辨率LED显示屏,能够创建动态和逼真的虚拟场景作为拍摄背景。在LED虚拟拍摄棚中,屏幕可以显示预先渲染好的CGI(计算机生成图像)内容或者实时渲染的3D场景,这些内容与演员和实物道具交互,共同构成最终的镜头画面。

  目前通过其虚拟拍摄系统UniStudio,可提供一站式虚拟拍摄解决方案。据最新数据统计,全球数字影棚大概有160个,洲明科技及其旗下ROE公司(雷迪奥)参与建设的有130个左右,并且公司积极拥抱,提出了LED+AI战略,在光显行业成为首个获得微软独立软件开发商(ISV)认证的企业,同时获得了OpenAI官方接入许可。

  “未来一旦Sora开放接入,洲明科技有望第一时间使用到全球最先进的视频生成技术。”刘俊表示,过去洲明为客户服务时,往往面临内容制作周期长、创新创意不足等问题,而Sora的出现可以有效解决这些问题,极大地丰富LED屏幕所承载的内容表现形式。

  在刘俊看来,文生视频等AI应用加持下,虚拟拍摄的专业门槛将随之降低,未来有望加速普及到企业级和消费级市场。

  “当前数字影棚发展还处于影视工业级,接下来在Sora这些AI应用推动下,虚拟拍摄效率将提升,专业门槛将降低。”刘俊预计,未来虚拟拍摄将工业级制作门槛将降低;另一方面随着LED屏幕进入企业和家装应用,虚拟拍摄将从当前百计影视工业级市场进入万计企业级市场,甚至渗透亿计消费级市场,最终实现全民创作。

TOP