OPENAI为ChatGPT推出多模态版本 可以语音对话以及识别图像内容 – 蓝点网
发布时间:2025-11-03 20:38:20 作者:玩站小弟
我要评论
OPENAI 昨天晚上宣布 ChatGPT 将支持语音对话,该功能仅限于 Android 和 iOS 版 ChatGPT,并且可以上传图片由 ChatGPT 进行分析、识别并给出回答。当这个功能可用后
。
OPENAI 昨天晚上宣布 ChatGPT 将支持语音对话,推出态版该功能仅限于 Android 和 iOS 版 ChatGPT,多模对话点网并且可以上传图片由 ChatGPT 进行分析、本可别图识别并给出回答。语音
当这个功能可用后,及识用户转到 ChatGPT 设置里点击新功能,像内然后就可以开启语音对话功能,容蓝还可以从 5 个声音里选择一个。推出态版

OPENAI 表示:
新的多模对话点网语音功能由心的文本转语音模型提供支持,能够仅从文本和几秒钟的本可别图样本语音中生成类似人类的音频。我们与专业配音演员合作创作了每一个声音,语音我们还使用我们的及识开源语音识别系统 Whisper 将您的声音转录为文本。
第二个功能是像内图像识别功能,用户可以使用移动端 ChatGPT 拍照或选择照片发送给 AI,容蓝然后 ChatGPT 会像素级分析图片内容并按照用户提问给出详细的推出态版回答,例如分析工作图表、在设备工作异常时进行故障排除等等。
OPENAI 表示:
图像理解由多模态 GPT-3.5 和 GPT-4 提供支持,这些模型将其语言推理技能应用于广泛的图像中,例如照片、屏幕截图、包含文本的和图像的文档等。
新功能将在接下来几周推出,首先获得该功能的是 ChatGPT Plus 和企业版用户,不过这些功能也会在后续支持免费版用户,同时也会开放 API 给开发者们。
最后,OPENAI 上周推出了图像生成模型 DALL-E 3,这个模型将可以与 ChatGPT 集成,将在 10 月份推出。
相关文章
《龙腾世纪:影障守护者》预计将在今年秋季发售2024-07-27 14:34:06编辑:Reset 《龙腾世纪:影障守护者2025-11-03
本日2月1日),GameSpot公布了《沉寂岭:短讯》完整真机演示,第一人称心机可骇游戏《沉寂岭:短讯》现已免费上线PS5仄台。饱吹片:《沉寂岭:短讯》是第一人称心机可骇游戏。女主安妮塔住正在一栋奇特2025-11-03
正在我们的印象里,提起电子游戏中的尾要角色,仿佛大年夜家起尾念到的皆是肌肉型男吧(笑)?而自挨从某着名游戏收止商那边传出“用女人当配角游戏没有好卖”的讲吐以后,“游戏让女人走开”如许的没有雅念,特别是2025-11-03
易车讯近日,有海外媒体曝光了奔驰全新E级插混版的谍照,该车或将于2023年上半年亮相,随后预计会在2024年开始销售。外观设计方面,虽然新车包裹严密,但是仍旧能看到许多细节,比如拥有类似S级的前脸设计2025-11-03
LOL最近季中赛RNG夺冠,对此官方也放出了新的冠军之夜庆典活动,活动将在5月26日开启,可以领取到永久皮肤奖励,下面是活动内容预告,有兴趣的话可以了解一下。亲爱的召唤师恭喜LPL,恭喜RNG。征服之2025-11-03
【家电资讯-家电新闻 - 行业新闻,作者:编辑】 近日,TCL科技集团股份有限公司000100.SZ,以下简称“TCL”2025-11-03

最新评论