1月23日,北京智谱华章科技有限公司宣布旗下智谱GLM-PC开放体验,标志着自主操作电脑的多模态Agent迎来重要升级。
GLM-PC是基于智谱多模态大模型CogAgent,全球首个面向公众、回车即用的电脑智能体。它能像人类一样“观察”和“操作”计算机,协助用户完成各类电脑任务。
GLM-PC v1.0于2024年11月29日发布并开放内测。此次升级推出了“深度思考”模式,增加了专用于逻辑推理和代码生成的功能,还提供了对Windows系统的支持。
GLM-PC具备多项强大能力。在代码生成与逻辑执行规划方面,可综合分析目标与可用资源,生成执行路线图并分解大型任务。循环执行功能可在规划后启动代码生成模块,实现从输入到输出的完整闭环。其长思考能力能实时调整、反思修正和自我纠错。
在图像与GUI认知上,能准确识别图形界面元素,理解功能与交互逻辑,还能进行图像语义解析和多模态信息融合。
智谱GLM-PC的开放体验,为用户带来了更智能、高效的电脑操作新体验,有望在办公、学习等诸多领域发挥重要作用。
全部0条评论
快来发表一下你的评论吧 !