浪潮软件申请基于多模态大模型的文本到视频全链路生成方法及系统专利,实现长视频生成的叙事连贯性

金融界2025年8月19日消息,国家知识产权局信息显示,浪潮软件集团有限公司申请一项名为“基于多模态大模型的文本到视频全链路生成方法及系统”的专利,公开号CN120512591A,申请日期为2025年07月。

专利摘要显示,本发明公开了基于多模态大模型的文本到视频全链路生成方法及系统,属于人工智能生成内容技术领域,通过多个智能体协同工作,分析用户输入文本,构建跨模态记忆库,基于记忆库内容确保生成分镜的视频和音频的统一,实现从文本到视频的全流程自动生成;该方法的实现包括以下步骤:获取用户文本输入;文本分析,通过协同工作的Agent,从输入文本中动态提取、分析、生成、关联、存储图文音多模态信息,构建多模态记忆库;生成分镜,根据记忆库生成分镜视频和音频;音视频合成,音画同步对齐后形成最终视频。

天眼查资料显示,浪潮软件集团有限公司,成立于2000年,位于济南市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本200000万人民币。通过天眼查大数据分析,浪潮软件集团有限公司共对外投资了22家企业,参与招投标项目5000次,专利信息1485条,此外企业还拥有行政许可35个。

本文源自金融界

展开阅读全文

更新时间:2025-08-20

标签:科技   连贯性   视频   浪潮   模型   文本   专利   方法   系统   软件   集团有限公司   记忆   天眼   企业

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top