MiniGPT-4来了

不知不觉,距 GPT-4 首次公开问世,已经过去一个月了。

在这段时间,有不少人拿到了 GPT-4 API 权限,开通了 ChatGPT Plus,提前体验了 GPT-4 的能力。

这些人无一例外,都被 GPT-4 强大的逻辑分析、统筹规划能力深深折服。

无论是论文创作、编写代码、还是数据分析,GPT-4 都给出了令人惊艳的表现。

不过,大家可别忘了,GPT-4 作为一个多模态大语言模型,它不仅能生成文字内容,还能理解图像输入内容,让用户直接与图片进行对话。

一个月前,OpenAI 向外界演示了 GPT-4 如何通过手绘草图,直接生成网站,让当时不少围观群众看的目瞪口呆。

不仅如此,它还能 get 到图像里面的笑点,识别数学题目并依次给出解答步骤。

我始终觉得,图像对话才是 GPT-4 真正令人心神向往之处。但可惜的是,这个功能至今仍没有对外开放。想不想在线体验呢,请先关注并会发送链接。

除了 Be My Eyes、可汗学院等少数几家与 OpenAI 有建立合作的企业,大部分人还是只能体验 GPT-4 的文本对话能力。

原本我以为只能苦等 OpenAI 发布更新,才能体验上这个功能,没成想今天让我找到了这么一个项目。

该项目名为 MiniGPT-4,是来自阿卜杜拉国王科技大学的几位博士做的。

它能提供类似 GPT-4 的图像理解与对话能力,让你先人一步感受到图像对话的强大之处。

未来在图像、声音、视频等领域,基于这些大语言模型所造出来的应用,其实际效果都不会太差。

这个项目证实了大语言模型在图像领域的可行性,接下来应该会有不少开发者入场,将 GPT-4 的能力进一步往音频、视频等领域延伸,进而让我们得以看到更多有趣、令人惊艳的 AI 应用。#gpt4# #chatgpt到底有多牛#

展开阅读全文

页面更新:2024-05-11

标签:阿卜杜拉   在线   惊艳   模型   图像   强大   领域   能力   语言   功能

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top