2025年1月23日,全球首个面向公众的、回车即用的电脑智能体GLM-PC再次升级,引发广泛关注。GLM-PC基于智谱多模态大模型CogAgent,能像人类一样“观察”和“操作”计算机,协助用户高效完成各类电脑任务。

自2024年11月29日发布GLM-PC v1.0并开放内测以来,该智能体不断优化升级。最新推出的“深度思考”模式,增加了逻辑推理和代码生成功能,使得GLM-PC在处理复杂任务时更加得心应手。此外,GLM-PC还实现了对Windows系统的支持,进一步拓宽了其应用场景。

images.png

GLM-PC的架构设计充分考虑了Agent的模型能力提升与协作架构优化。一个完备的Agent需满足在感知层面接收文字、图像、视频、音频等多元信号;在思维层面具备逻辑思维、任务规划能力及高效感知、灵活操作能力;在执行层面能完成全GUI空间操作,接收环境反馈并自我纠正。GLM-PC借鉴人类“左脑”与“右脑”分工,通过代码生成与图形界面理解,实现逻辑推理与感知认知的深度结合,赋予其在逻辑性与创造性间平衡的能力。

在实际应用中,GLM-PC展现了强大的功能。其“左脑”负责严谨的逻辑推理与任务执行,能够迅速制定出详细的任务规划方案,并通过循环执行机制确保任务的精确执行与高度自动化。例如,GLM-PC能够自动提取图片中的商品数据,存储至Excel,并自动将商品加入淘宝购物车,实现一站式购物流程。其“右脑”则专注于深度感知与交互体验,能够准确识别图形界面元素,理解用户行为,对复杂图像进行深入语义分析,并融合图像与文字信息形成全面感知结果。这使得GLM-PC在数据整理、信息提取等方面表现出色。

值得一提的是,GLM-PC还展示了左右脑协作的强大能力。在处理复杂逻辑任务的同时,GLM-PC还能在开放性问题上展现更高的适应能力、创造力和泛化能力。通过动态优化和情境感知,GLM-PC能够帮助用户探索更高效的解决方案,特别是在循环任务处理、多步推理执行以及长链条任务管理等方面。

此外,智谱还在积极推动GLM-PC与知名PC厂商的合作,共同推动AIPC(AI个人电脑)的创新与发展。AIPC不仅是一台电脑,更是AI Agent在个人计算领域的全新应用,能够为用户提供更高效、更智能的工作与生活体验。

下载&体验:https://cogagent.aminer.cn