OPENAI为ChatGPT推出多模态版本 可以语音对话以及识别图像内容 – 蓝点网

  发布时间:2025-11-03 20:38:20   作者:玩站小弟   我要评论
OPENAI 昨天晚上宣布 ChatGPT 将支持语音对话,该功能仅限于 Android 和 iOS 版 ChatGPT,并且可以上传图片由 ChatGPT 进行分析、识别并给出回答。当这个功能可用后 。

OPENAI 昨天晚上宣布 ChatGPT 将支持语音对话,推出态版该功能仅限于 Android 和 iOS 版 ChatGPT,多模对话点网并且可以上传图片由 ChatGPT 进行分析、本可别图识别并给出回答。语音

当这个功能可用后,及识用户转到 ChatGPT 设置里点击新功能,像内然后就可以开启语音对话功能,容蓝还可以从 5 个声音里选择一个。推出态版

OPENAI为ChatGPT推出多模态版本 可以语音对话以及识别图像内容

OPENAI 表示:

新的多模对话点网语音功能由心的文本转语音模型提供支持,能够仅从文本和几秒钟的本可别图样本语音中生成类似人类的音频。我们与专业配音演员合作创作了每一个声音,语音我们还使用我们的及识开源语音识别系统 Whisper 将您的声音转录为文本。

第二个功能是像内图像识别功能,用户可以使用移动端 ChatGPT 拍照或选择照片发送给 AI,容蓝然后 ChatGPT 会像素级分析图片内容并按照用户提问给出详细的推出态版回答,例如分析工作图表、在设备工作异常时进行故障排除等等。

OPENAI 表示:

图像理解由多模态 GPT-3.5 和 GPT-4 提供支持,这些模型将其语言推理技能应用于广泛的图像中,例如照片、屏幕截图、包含文本的和图像的文档等。

新功能将在接下来几周推出,首先获得该功能的是 ChatGPT Plus 和企业版用户,不过这些功能也会在后续支持免费版用户,同时也会开放 API 给开发者们。

最后,OPENAI 上周推出了图像生成模型 DALL-E 3,这个模型将可以与 ChatGPT 集成,将在 10 月份推出。

  • Tag:

相关文章

  • 《龙腾世纪:影障守护者》预计将在今年秋季发售

    《龙腾世纪:影障守护者》预计将在今年秋季发售2024-07-27 14:34:06编辑:Reset 《龙腾世纪:影障守护者
    2025-11-03
  • 剧透警告 《沉寂岭:短疑》完整真机公布

    本日2月1日),GameSpot公布了《沉寂岭:短讯》完整真机演示,第一人称心机可骇游戏《沉寂岭:短讯》现已免费上线PS5仄台。饱吹片:《沉寂岭:短讯》是第一人称心机可骇游戏。女主安妮塔住正在一栋奇特
    2025-11-03
  • 中媒查询拜访:游戏销量是没有是与配角性别有闭?

    正在我们的印象里,提起电子游戏中的尾要角色,仿佛大年夜家起尾念到的皆是肌肉型男吧(笑)?而自挨从某着名游戏收止商那边传出“用女人当配角游戏没有好卖”的讲吐以后,“游戏让女人走开”如许的没有雅念,特别是
    2025-11-03
  • 奔驰全新E级插混版谍照 或将于2023年亮相

    易车讯近日,有海外媒体曝光了奔驰全新E级插混版的谍照,该车或将于2023年上半年亮相,随后预计会在2024年开始销售。外观设计方面,虽然新车包裹严密,但是仍旧能看到许多细节,比如拥有类似S级的前脸设计
    2025-11-03
  • ​LOL冠军之夜庆典活动

    LOL最近季中赛RNG夺冠,对此官方也放出了新的冠军之夜庆典活动,活动将在5月26日开启,可以领取到永久皮肤奖励,下面是活动内容预告,有兴趣的话可以了解一下。亲爱的召唤师恭喜LPL,恭喜RNG。征服之
    2025-11-03
  • TCL“换道”半导体光伏和半导体材料 显示面板迎“拐点”

    【家电资讯-家电新闻 - 行业新闻,作者:编辑】 近日,TCL科技集团股份有限公司000100.SZ,以下简称“TCL”
    2025-11-03

最新评论