当前位置: 首页  >> 数字生态  >> 查看详情

OpenAI发布Sora大模型,数据是最关键的涌现因素?

来源: 环球科技网  日期:2024-02-22  责编: 殷绪江  
分享:
   【环球科技网】近日,美国人工智能公司OpenAI发布了“文生视频”大模型Sora。它能够根据文本描述生成长达60秒连贯流畅的的视频,同时保持视频中出现的人物、景色的连贯性,其中既能实现多角度镜头的自然切换,还包含复杂的场景和生动的角色表情,展现出令人惊叹的视频生成效果。
   随着模型的发布,业内围绕技术的猜想随即展开。有人认为Sora创新的模型架构为大模型的发展开辟了新道路,也有人认为Sora的推出让通用人工智能到来的日期大大提前,还有市场人士表示Sora的爆红与OpenAI高超的营销密不可分。可以预见的是,Sora的横空出世,无疑将促使人工智能引领新一轮行业变革。
   还有业内人士指出,AI视频生成的难点在于,一方面视频是连续的多帧图像,并且要有逻辑性,并非简单的图片组合;另一方面是带来模型复杂度提升、计算难度和成本的提升。此外,文生视频需要大量的“文本-视频”配对数据,而目前缺乏多样化的数据集,且数据标注的工作量较大。因而此前视频大多为5-15秒,而Sora将视频时长提升至1分钟,支持生成多个镜头,同时基本维持了角色和视觉风格的一致性,并能在一定程度上“理解”现实世界。
   在Sora的技术报告中,完全没有讨论训练来源和构建,这可能意味着数据很可能是Sora成功的最关键因素。很多人好奇Sora的数据来自哪里,当前的猜测有:游戏引擎、电影、纪录片、电影长镜头等。例如,PyTorch创始人Soumith Chintala从视频推测Sora是由游戏引擎驱动的,并为游戏引擎生成组件和参数。纽约大学助理教授谢赛宁推测,整个Sora模型可能有30亿个参数。
   文生视频模型需要大量的视频数据进行训练,包含各种场景、人物、动作、物品等,以帮助模型学习视频的生成规律和运动轨迹等重要元素。在训练数据层面,云测数据认为数据标注的质量与效率、行业知识经验丰富程度和数据的隐私安全,是发挥着训练数据价值的重要维度,影响着模型的效果。
   有科技大咖指出,Sora可能使用了虚幻引擎5合成的游戏视频训练数据,从视频的色彩、细节来看这个判断有一定的可信度。这样看来OpenAI手里已经掌握了一批高质量视频训练数据,同时找到了新的高效数据合成方法。此外,在训练方法、模型架构、算力需求等方面,Sora也进行了创新,将ChatGPT、DALL·E 3等模型融合在一起。
   目前Sora的训练数据源是业界普遍的关注重点,但OpenAI一如既往遵循“ClosedAI”原则,并没有透露相关信息。










 

【免责声明】: 凡注明 “环球科技网” 字样的图片或文字内容均属于本网站专稿,如需转载图片请保留 “环球科技网” 水印,转载文字内容请注明来源“环球科技网”;凡本网注明“来源:XXX(非环球科技网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其作品内容的实质真实性负责,转载信息版权属于原媒体及作者。如转载内容涉及版权或者其他问题,请投诉至邮箱;1978751725@qq.com 
 
本网公告
环球科技网从不发布负面新闻资讯,也绝不会发布负面信息。如发现负面信息链接请甄别是否为环球科技网所发。
本网系北京伯乐传媒广告有限公司主办、所有。本网唯一域名(www.hqkjw.cn),其它域名链接均为假冒。望广大网民及企业主认真甄别。


咨询、采访、合作、投稿等请致电:13911566744(含微信)

     
 


 

相关新闻

  • Testin云测:大模型时代下以AI技术助力企业数字化转型 Testin云测:大模型时代下以AI技术助力企业数字化转型 2024-01-19 13:49:50

       【环球科技网】自上世纪50年代英国数学家图灵提出“人工智能”概念后,人工智能发展历经起伏。近年来,随着芯片等相关技术进步、算力提高,深度学习技术取得重要进展,现如今人工智能已能够大规模落地应用。未来,随着基于大规模图像、语音、视频等多模态数据的跨语言的自监督预训练模型进一步发展,其认知、推理能力不断提升,人工... [阅读]

  • Testin云测:数字经济浪潮下助力软件数字化 Testin云测:数字经济浪潮下助力软件数字化 2023-12-29 11:52:15

       【环球科技网】在当下,5G、人工智能、大数据等科技正在加速迭代升级,数字技术作为新一轮科技革命和产业变革的先机,大力推动了企业数字化转型发展,为各行业企业开展数字化转型提供了覆盖面更广、成本更低、使用更便捷、扩展性更强的技术新框架,带动行业企业进一步深化数字转型变革。因此,加快数字经济建设也成为加快制造强国、网络强国和数字中国建设的... [阅读]

  • Testin云测:积极响应AI与大模型时代,护航企业数字化转型 Testin云测:积极响应AI与大模型时代,护航企业数字化转型 2023-12-22 12:07:42

       【环球科技网】当前,我国经济正处于由高速增长阶段向高质量发展阶段转变的关键期,一场以人工智能技术为主要特征的数字化转型,正在全球范围内蓬勃兴起。几年前,企业数字化转型还是一道选择题,如今俨然成为一道必答题。当下,企业数字化转型进入深海区,企业在创新的过程中面临了新的机遇和新的挑战,开始加速向广度和深度进发。    ... [阅读]

  • 云测数据获评中国信通院“以数据为中心的人工智能应用”优秀案例 云测数据获评中国信通院“以数据为中心的人工智能应用”优秀案例 2023-12-01 17:02:22

       【环球科技网】11月28日,为破解AI数据短缺难题、推动数据要素价值释放,第一届人工智能数据高质量发展(ADA)论坛暨中国人工智能产业发展联盟数据委员会筹备会在北京石景山首钢园顺利召开。本次会议吸引了来自学术研究机构、AI数据拥有方、数据加工方和数据需求方的共计百余位专家代表参会,共商共议人工智能高质量数据发展蓝图。  ... [阅读]