OpenAI推出Vision模型版GPT-4 Turbo，融合文本与图像理解

微云疏影 2024-04-10 1180

　　2023年4月10日，OpenAI宣布，最新版GPT-4 Turbo模型—GPT-4 Turbo with Vision正式上线，可通过OpenAI API面向开发者推广普及。

　　据悉，此模型沿用GPT-4 Turbo系列特有的12.8万token窗口规模及截至2023年12月的知识库架构，其创新亮点则是强大的视觉理解功能。

　　在此之前，开发者需分阶段使用不同模型处理文本与图像数据，而该模型实现了两者的综合运用，大大缩短了开发周期，拓宽了实际应用领域。

　　OpenAI同时展示了该模型的典型应用场景，如AI软件工程师Devin运用GPT-4 Turbo with Vision进行编程辅助；Healthify健康APP运用其扫描用户饮食相片并进行营养分析；Making Real创意平台将用户草图自动转换成完整可行的网站。

　　尽管GPT-4 Turbo with Vision暂时未被应用到Chatgpt或亲民化使用，但OpenAI已释放出即将部署在Chatgpt的相关信号。

打开APP阅读更多精彩内容