融合视觉能力,OpenAI向开发人员提供GPT-4 Turbo with Vision
2024-04-10 09:35:55爱云资讯阅读量:3,159
OpenAI 宣布,具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍提供。
据了解,该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库,最大的革新之处在于其新增的视觉理解能力。在过去,开发者需要调用不同的模型来处理文本和图像信息,而 GPT-4 Turbo with Vision 则将两者合二为一,极大简化了开发流程,并带来了广泛的应用前景。
OpenAI 也分享了一些开发者正在使用该模型的有趣案例。例如,AI 软件工程助手 Devin 利用 GPT-4 Turbo with Vision 辅助编程;健康健身应用程序 Healthify 使用该模型扫描用户饮食照片,通过图像识别提供营养分析;创意平台 Make Real 则利用该模型将用户的草图转化为可运行的网站。
目前,GPT-4 Turbo with Vision 尚未应用于 ChatGPT 或开放给大众使用,不过 OpenAI 暗示该功能即将登陆 ChatGPT。
相关文章
- OpenAI计划于2025年1月推出新型智能体Operator
- OpenAI正式推出ChatGPT搜索功能,微美全息乘AI浪潮培育生产力驱动业务革新
- OpenAI重启机器人团队 增强现实眼镜前负责人将加盟
- 模型能力比肩OpenAI-o1 夸克全新“AI搜题”让新题、难题都有解
- ChaGPT网页搜索引擎上线 OpenAI挑战谷歌
- OpenAI推出ChatGPT的Windows和Mac电脑版高级语音模式
- OpenAI从2026年开始使用AMD芯片 将自行研发人工智能硬件
- OpenAI计划在12月推出其下一代前沿模型Orion
- OpenAI推出Windows版ChatGPT客户端
- 马斯克在OpenAI的总部旧址举办的AI招聘活动
- OpenAI刚刚融资66亿美元,构建越来越大的人工智能模型
- OpenAI开启推理算力新Scaling Law,AI PC和CPU的机会来了
- OpenAI拟议大规模重组成营利性公司
- OpenAI首席技术官米拉·穆拉蒂宣布离职
- OpenAI成立了一个独立的安全委员会,有阻止其模型的发布的权限
- OpenAI推出首款具有推理能力的模型o1