融合视觉能力,OpenAI向开发人员提供GPT-4 Turbo with Vision
2024-04-10 09:35:55爱云资讯3231
OpenAI 宣布,具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍提供。
据了解,该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库,最大的革新之处在于其新增的视觉理解能力。在过去,开发者需要调用不同的模型来处理文本和图像信息,而 GPT-4 Turbo with Vision 则将两者合二为一,极大简化了开发流程,并带来了广泛的应用前景。
OpenAI 也分享了一些开发者正在使用该模型的有趣案例。例如,AI 软件工程助手 Devin 利用 GPT-4 Turbo with Vision 辅助编程;健康健身应用程序 Healthify 使用该模型扫描用户饮食照片,通过图像识别提供营养分析;创意平台 Make Real 则利用该模型将用户的草图转化为可运行的网站。
目前,GPT-4 Turbo with Vision 尚未应用于 ChatGPT 或开放给大众使用,不过 OpenAI 暗示该功能即将登陆 ChatGPT。
相关文章
- OpenAI计划推出具备推理能力的开放权重大模型
- OpenAI宣布完成新一轮400亿美元的融资,由软银领投
- OpenAI推出GPT4.5研究预览版 情商更高、幻觉更少 Altman:下周再增数万GPU
- 涂鸦智能集成DeepSeek、豆包、OpenAI等全球先进AI大模型,发布亿元补贴助力AI硬件创新
- OpenAI前首席技术官米拉·穆拉蒂官宣创业, 成立思维机器实验室
- OpenAI董事会一致拒绝马斯克收购公司的提议
- OpenAI首席执行官奥尔特曼公布GPT-5计划 :产品矩阵大整合,免费无限使用
- 马斯克拟974亿美元收购OpenAI 奥尔特曼回应:不出售
- OpenAI上线首款AI智能体Operator: 能操控电脑,像人类一样浏览网页
- AI大模型群雄争霸白热化,OpenAI/英伟达/微美全息商业化战略日渐明朗
- OpenAI宣布桌面版ChatGPT推出应用协作功能,编程能力得到增强
- OpenAI将通过API向特定的开发者发布完整的o1推理模型
- OpenAI宣布向所有用户开放ChatGPT人工智能搜索功能
- 抢先OpenAI Sora谷歌新推Veo模型,亚马逊/微美全息加入AI视频生成竞赛引关注
- OpenAI正式推出AI视频生成模型Sora 可生成长达20秒的视频
- OpenAI CEO:2025年将看到首个AGI案例 颠覆性将远超预期