文心一格后又一个文字生成图片智能工具上线，阿里云发布“通义万相”

7月7日，阿里云在世界人工智能大会（WAIC2023）上宣布AI绘画创作大模型“通义万相”开启定向邀测。这也是一款基于阿里研发的组合式生成模型Composer的产品，可辅助人类进行图片创作，未来可应用于艺术设计、电商、游戏和文创等应用场景。也是继聊天机器人“通义千问”和聚焦音视频处理的“通义听悟”之后，阿里云通义大模型家族的第三位成员。而这距离第一款产品“通义千问”的发布，仅过去了5个月。从2022年9月通义大模型的推出到现在，也不过过去了10个月。

阿里云智能集团首席技术官（CTO）周靖人透露，这是阿里云大模型全面掌握多模态能力的关键一步，该应用将逐步向行业客户开放。

自chatgpt上线以来，国内各大公司也纷纷在人工智能领域发力，在这次大会上，百度的“文心一言”、科大讯飞星火认知大模型、华为云盘古大模型、阿里云通义千问、京东云言犀大模型、清华大学ChatGLM、360智脑大模型等各大厂商研发的基础应用大模型也都集体亮了相。

引发大众关注的是，“通义万相”是继百度推出的“文心一格”后国内第二款文生图智能工具。此前，文心一格率先发布时国内关注度很高，但文心一格最初的表现并不算太好，在文字生成图片上，出现了令人啼笑皆非的“驴肉火烧”、“夫妻肺片”等错误理解，图片处理能力无法令大众满意。

时隔一年，“通义万相”会做成什么样引起网友们的好奇。从获取到定向邀测资格博主的评测中，记者了解到，其首发功能都是现在国外大火的AI绘画模型Stable Diffusion和Midjourney所具有的，但由于刚上线，其完善性还无法与国外的同领域产品相比较。同时因为是闭源产品的缘故，可能在后续功能的自由及丰富度上远难及开源的Stable Diffusion。

“通义万相”首批上线了3大功能：在基础文生图功能中，可根据文字内容生成水彩、扁平插画、二次元、油画、中国画、3D卡通和素描等风格图像；在相似图片生成功能中，用户上传任意图片后，即可进行创意发散，生成内容、风格相似的AI画作。值得注意的是，该模型还在业内率先支持图像风格迁移，用户上传原图和风格图，可自动把原图处理为指定的风格图，而相似图片生成和风格迁移这两大功能，都是“文心一格”目前尚不具备的。

AI技术迭代飞快，一年前的文字智能生成图片功能在如今来看已经不够令人惊喜，更多刷新认知的功能在不断出现，尽管目前而言各类AI文图处理工具要完全应用到商业领域尚且还有一段距离，但技术的累积速度确实令人惊叹，蝶变或许就在下一个瞬间。

扬子晚报/紫牛新闻记者沈昭薛雅文（实习）

校对盛媛媛

展开阅读全文

页面更新：2024-03-04

标签：阿里图片原图大众人工智能上线模型风格领域文字功能智能工具产品

1 2 3 4 5

文心一格后又一个文字生成图片智能工具上线，阿里云发布“通义万相”

你买的手机等设备是正品吗？查询攻略来了

外媒：苹果计划2024年开始销售Vision Pro头显

三星移动热点功能升级可监测共享数据设置临时密码

筑牢算力底座赋能人工智能

全球变暖下森林向更高海拔爬升的物候学依据找到

波音中国总裁谢利嘉计划年内退休，柳青将代理总裁职务

星舰发射失败，33台发动机的大力出奇迹，注定是一条不归路

50万元！益阳农商银行首笔“福祥·湘农e担贷”落地

厄尔尼诺到底有没有投资机会？若有又能持续多久？

法国启动“未来网络”研究计划并推出“法国6G”平台

（财经·行情）纽约股市三大股指10日上涨

岩石股份董事会换届韩啸任董事长

轮胎产销两旺三角轮胎上半年预盈5.95亿元至6.15亿元

上期所：6月份处理异常交易行为15起

ST中安：控股股东所持1.41%公司股份将被司法拍卖

三星移动热点功能升级可监测共享数据设置临时密码

筑牢算力底座赋能人工智能

前瞻功能缺损影响快乐期待

微信管理系统，是你解决问题的新工具吗？

美国家量子计划咨询委员会发布:《更新国家量子计划：维

（图表）「经济」市场监管总局发布新修订的《婴幼儿配方乳

甘肃宕昌县优质特色农产品亮相乌鲁木齐线上线下火爆

暑期购机想选O系产品？从价位和特点入手，这四款很值得推

AI阅读助手ChatDOC：重新定义阅读方式的AI文献阅读-文档

紧急提醒！多人已中招，手机这个功能赶紧关