生成式人工智能的发展趋势与应用场景

2024-04-14

生成式人工智能的发展趋势与应用场景


2024年2月发布的文生视频模型Sora引起关注。这一技术的问世被认为是视频生成领域的重大突破。对比同样引起轰动的ChatGPT,二者在技术路线和产品定位上有所联系,又有所区别。一方面Sora结合了ChatGPT所采用的模型架构,能够结合数个静止画面生成连续的视频,也可以自动修补残缺的视频段。另一方面Sora和ChatGPT都有良好的自然语言理解能力,可以根据用户的描述生成与调整视频内容,也可以对用户提供的素材进行总结归纳和补充。Sora的问世是OpenI在模型架构、数据管理等方向积累创新的结果,其背后是GPT系列的技术转化和新技术创新的融合。ChatGPT侧重于对文本内容的理解和生成,用户可以与之进行对话问答,也可以指令其撰写文章、编写代码等,其基础功能主要由文字交互实现。最常见的应用场景主要是文本内容的处理,包括对文字的解读、重组、拓展、排序等。Sora则侧重于视频内容的创造,其核心功能是根据文本提示生成视频内容,在理解和模拟物理世界的前提下,构造出虚拟的世界并展现这个世界的交互规律。 


文生视频模型都在多个方面表现出强大的能力,但其本身并不完美。类似的生成式模型仍然存在一些问题,如不能完全反映所有的物理规律,主要表现为一些违背生活常识和科学认识的情况仍然会发生。上述文生视频模型缺陷由来已久,并且在短期内难以得到很好的解决,在维持、扩大模型优势的同时克服这些缺陷将成为人工智能产业下一阶段的重点。 


首先文生视频模型的首要缺陷是其巨量的算力资源消耗。相较于主流的大语言模型算力,图像参数要占用更多的算力资源。为了追求更好的模型性能,全球人工智能产业的算力需求还会进一步提高,算力匮乏的国家和地区将处于技术不利地位。 


其次是模型幻觉现象依然严重。与文本生成模型类似,视频生成模型也受幻觉效应影响。训练数据在压缩等处理环节中失真、用户提示词过于模糊或者根据安全策略不能响应时,模型会被迫填补空缺内容。这种填补有可能使模型陷入幻觉认识,输出与事实不符或者用户未要求的内容。 


全文约2553字,请下载后阅读、编辑。
阅读全文

(阅读全部图文内容,您需要先登录!)


推荐阅读

  1. 市人社局副局长2024年民主生活会对照检查发言材料
  2. 党支部宣传委员2024年组织生活会“四个带头”对照检查发言材料
  3. 2024年组织生活会支部班子对照检查材料
  4. X县中医医院网络意识形态工作责任制实施方案
  5. 街道办事处主任​2024年民主生活会“四个带头”个人对照检查发言材料
  6. 领导干部2024年度组织生活会“四个带头”对照检视剖析材料
  7. 市人民医院2024年度民主生活会领导班子对照检视发言材料
  8. 副市长在2024年全市卫生健康工作会议上的讲话
  9. 党员领导干部2024年民主生活会个人对照检查材料汇编(8篇)
  10. 组织委员2024年民主生活会“四个带头”个人对照材料
  11. 支部党员大会会议记录(讨论确定困难党员、慰问对象)
  12. 2024年度民主生活会个人对照检视发言材料(银行党委委员、副行长)
  13. 市直机关领导班子2024年度专题民主生活会对照检查材料(四个带头)
  14. 县国土空间规划股2024年工作总结及2025年工作计划
  15. 党课:持续巩固深化党纪学习教育成果推进党纪学习教育常态化长效化
  16. 文旅局2024年度民主生活会领导干部对照检查材料
  17. 国企集团公司2024年安全生产工作总结报告
  18. 某法院党组班子2024年度民主生活会对照检查材料(四个带头)

文章排行

微信端二维码

  1. 扫码进入《老笔杆子》微信端

客服二维码

  1. 扫码联系《老笔杆子》客服