OPENAI邀请部分用户测试GPT
在 3 月份 OPENAI 发布 GPT-4 的邀请用户时候,在其博客中就提到了 Visual Inputs 视觉输入功能,部分GPT-4 模型不仅支持文本内容,测试实际上也是邀请用户支持图像识别的,只不过到现在该功能都没有公开发布。部分
目前已经有部分用户收到 OPENAI 发送的测试邀请,可以在 ChatGPT 中测试 GPT-4 with Vision (Alpha),邀请用户这个功能能实现的部分场景其实很多,识别图像中的测试物体只是最基础的应用。
在 OPENAI 自己提供的邀请用户示例中,是部分将 Sketch 转换为代码,也就是测试给定一个设计文件,GPT-4 识别设计文件并帮你编写代码,邀请用户这对前端工作者来说或许有不小的部分帮助。
还有使用场景就是测试类似于 OCR 识别了,例如对打印的 Excel 表格进行拍照,然后将其转换为电子簿,这类功能在很多应用里已经支持,现在 GPT-4 也支持类似功能了,不过不知道 GPT-4 是不是也用的 OCR 类技术。

在实际使用方面,用户可以批量输入内容,而不是单次输入一张图片去识别,例如可以将文本和图片穿插发送给 GPT-4,这样也可以识别并且可能还会有助于用户理解。
例如在很多论文中就有大量配图,GPT-4 (暂时不考虑输入上限问题) 可以识别论文内容搭配图片进行理解,可以增强思维链,帮助 GPT-4 给出更好的回答。
由此还能衍生出一个使用场景,那就是可以利用此功能来帮助视力障碍用户,可惜 GPT-4 的联网模式没了,不然视力障碍用户可以直接把链接发给 GPT-4,让 GPT-4 识别链接内容的同时,也可以解释网页里的配图。
OPENAI 称图像输入功能目前属于研究测试阶段,不公开提供,所以除非用户收到邀请,否则暂时无法使用此功能。
(责任编辑:焦点)
- ·3D动作游戏《DISORDER》上线Steam预计第四季度正式发售
- ·《爆破三国》足游水爆开测中 特性弄法大年夜汇总
- ·《新斗罗大年夜陆》8月28日新版本上线 尾个SS级魂师闪明退场
- ·《终究胡念:怯气启迪录》X王老凶跨界开做 iOS版8月29日正式上线
- ·3D动作游戏《DISORDER》上线Steam预计第四季度正式发售
- ·《文豪迷犬怪奇谭》新足进门大年夜齐,教您没有慌没有闲变大年夜神!
- ·《怯者斗恶龙 宝躲 苍之瞳战天空的罗盘》新真机截图:寻宝、挖宝、鉴宝!
- ·《灵魂骇客2》公布新PV 掀示“魔宴”等新要素
- ·LOL英雄联盟2018赛季正式开启 全新征程不容错过
- ·齐力布局元宇宙代价没有小 扎克伯格身家缩水远5000亿元














