3月5日,OpenAI为其明星产品ChatGPT揭晓了全新的“语音演绎”功能,命名为“朗读”,这一创新突破使得ChatGPT能够以五种迥异的音色将文本内容生动呈现。
此举旨在深化用户体验层次,提供更加直观、灵活的互动方式。目前,“朗读”功能已全面部署至ChatGPT的网页端平台及移动端iOS与安卓应用,让用户无论身处何地都能享受到这一听觉盛宴般的交流体验。
“朗读”功能不仅支持 37 种语言,还可以自动检测文本语言并进行朗读。值得注意的是,该功能同时适用于 GPT-4 和 GPT-3.5 版本的 ChatGPT。
这一更新展示了 OpenAI 在“多模态交互”(multimodal capabilities)方面所做的努力,即赋予人工智能模型通过多种媒介进行读取和响应的能力。有趣的是,就在不久前,OpenAI 的竞争对手 Anthropic 也在其人工智能模型中添加了类似的功能。
早在 2023 年 9 月,ChatGPT 就推出了“语音聊天”(voice chat) 功能,用户可以直接通过语音与聊天机器人对话,无需再进行文本输入。而此次推出的“朗读”功能可以让用户选择让 ChatGPT 将其文本回复朗读出来,甚至可以将其设置为默认的回复方式。
在移动应用上,用户只需长按文本即可打开“朗读”播放器,并进行播放、暂停或快退操作。网页端则会在文本下方显示一个扬声器图标,点击即可启动朗读功能。
文明上网,理性发言,共同做网络文明传播者