首页 >> 要闻 >

ChatGPT的新超能力生成式AI聊天机器人现在可以响应语音输入图片命令等

2023-10-18 10:53:19 来源: 用户:裴广毓 

OpenAI的ChatGPT现在更强大了。大语言模型聊天机器人现在通过图片和语音输入接受命令,使用户能够以更自然和直观的方式与 ChatGPT 进行交互。

“我们开始在 ChatGPT 中推出新的语音和图像功能。他们提供了一种新的、更直观的界面,允许您进行语音对话或向 ChatGPT 展示您正在谈论的内容,”OpenAI 宣布。

现在,在您兴奋之前,您应该知道此功能不适用于免费用户。该公司仅向 Plus 和 Enterprise 用户推出 ChatGPT 中的语音和图像。推出将在接下来的两周内进行。语音将在 iOS 和 Android 上提供(在您的设置中选择加入),并且图像将在所有平台上提供。开发人员也将很快获得此功能。

“你现在可以使用语音与你的助手进行来回对话。随时随地与它交谈,为您的家人请求一个睡前故事,或者解决餐桌上的争论。”

要使用新的图像功能,用户只需点击照片按钮即可捕获或选择图像。如果您使用的是 iOS 或 Android,请先点击加号按钮。您还可以讨论多个图像或使用机器人的绘图工具来指导您的助手。

图像理解由多模态 GPT-3.5 和 GPT-4 提供支持。这些模型将其语言推理技能应用于各种图像,例如照片、屏幕截图以及包含文本和图像的文档。

要开始使用语音,请前往移动应用程序上的“设置”>“功能” ,然后选择加入语音对话。然后,点击主屏幕右上角的耳机按钮,从五种不同的声音中选择您喜欢的声音。

新的语音功能由新的文本转语音模型提供支持,能够从文本和简短的语音样本生成类似人类的音频。OpenAI 与专业配音演员合作创作了每一个声音。它还使用其开源语音识别系统 Whisper 将口语单词转录为文本。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章