OpenAI推出Vision模型版GPT-4 Turbo,融合文本与图像理解

描述

  2023年4月10日,OpenAI宣布,最新版GPT-4 Turbo模型—GPT-4 Turbo with Vision正式上线,可通过OpenAI API面向开发者推广普及。

  据悉,此模型沿用GPT-4 Turbo系列特有的12.8万token窗口规模及截至2023年12月的知识库架构,其创新亮点则是强大的视觉理解功能。

  在此之前,开发者需分阶段使用不同模型处理文本与图像数据,而该模型实现了两者的综合运用,大大缩短了开发周期,拓宽了实际应用领域。

  OpenAI同时展示了该模型的典型应用场景,如AI软件工程师Devin运用GPT-4 Turbo with Vision进行编程辅助;Healthify健康APP运用其扫描用户饮食相片并进行营养分析;Making Real创意平台将用户草图自动转换成完整可行的网站。

  尽管GPT-4 Turbo with Vision暂时未被应用到Chatgpt或亲民化使用,但OpenAI已释放出即将部署在Chatgpt的相关信号。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分