4月10日消息,全球人工智能领军企业OpenAI欣然披露,其尖端研发成果——具备先进视觉理解能力的GPT-4 Turbo升级版本,即GPT-4 Turbo with Vision,已全面纳入OpenAI官方API服务体系,面向全球开发者开放使用权限。
这一举措标志着开发者社区现可广泛利用该模型的卓越视觉智能特性,以前所未有的方式将文本与图像信息无缝融合,推动创新应用的边界持续拓展。
据了解,该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库,最大的革新之处在于其新增的视觉理解能力。
在过去,开发者需要调用不同的模型来处理文本和图像信息,而 GPT-4 Turbo with Vision 则将两者合二为一,极大简化了开发流程,并带来了广泛的应用前景。
OpenAI 也分享了一些开发者正在使用该模型的有趣案例。例如,AI 软件工程助手 Devin 利用 GPT-4 Turbo with Vision 辅助编程;健康健身应用程序 Healthify 使用该模型扫描用户饮食照片,通过图像识别提供营养分析;创意平台 Make Real 则利用该模型将用户的草图转化为可运行的网站。
目前,GPT-4 Turbo with Vision 尚未应用于 ChatGPT 或开放给大众使用,不过 OpenAI 暗示该功能即将登陆 ChatGPT。
文明上网,理性发言,共同做网络文明传播者