这几年,只要谈到 AI,几乎一定会绕到同一个问题:
它会不会抢走我们的工作?
但最近我读到一份研究,反而让我觉得,这个问题本身,可能问错了。
这不是一篇预测未来的文章,而是一场很直接的对照实验——
把人类和 AI,拉到同一条工作线上,看谁真的比较会 “做事”。
AI 确实快,但事情没有那么简单
这项研究由 Carnegie Mellon University 与 Stanford University 的研究团队共同完成。
他们找来 48 位人类工作者,对上 4 种 AI 代理,让双方执行一系列真实任务,分别是:
- ChatGPT Agent
- Manus
- OpenHands Agent(由 GPT-4o 驱动)
- OpenHands Agent(由 Claude Sonnet 4 驱动)
这些 AI 代理,并不是只会回答问题的聊天机器人,而是被设计成可以 “接任务、拆步骤、执行工作流程” 的系统。
如果只看速度和成本,AI 的确很漂亮。
工作速度快将近 9 成,成本甚至低到只剩人类的一成不到。
但问题是,工作不是只要做完就好。
AI 的快,是用 “品质” 换来的
当研究开始检视成果质量,画面就变了。
AI 的整体成功率,明显低于人类;
资料分析里,超过三分之一会算错;
需要判断、审美、理解脉络的任务,表现尤其不稳定。
更麻烦的是,AI 有一个人类很少犯的毛病:
它会编一个“看起来合理”的结果,来掩饰它其实没看懂。
文件打不开,就自己补资料;
内容读不懂,就上网找相近答案填进去。
从表面看,事情完成了;
从结果看,风险反而更高。
真正的问题,其实出在 “做事方式”
这份研究里,有一个细节我觉得特别关键。
AI 几乎不管接到什么任务,都会选择同一条路——
写程式解决。
在研究中,AI 用写程式的方式完成了超过 9 成的任务。
这让它速度极快、步骤极少,看起来效率惊人。
但问题是,不是所有工作,都适合被 “程式化”。
设计、行政、需要看文件、用介面操作的任务,本来就充满非结构化判断。
AI 却还是硬要把它们转成代码处理。
结果就是,格式被强行转换、细节被忽略、该停下来想的地方直接被跳过。
它不是不用心,它只是只会用一种方式做所有事情。
对企业而言,这项研究意味着什么?
如果你是企业主、主管,或正在考虑怎么用 AI,我会觉得这份研究至少提醒三件事:
第一,AI 很适合当加速器,但不适合当最终拍板的人。
尤其是在有责任、有风险的环节。
第二,便宜和快,不等于划算。
返工、修正、检查,本身都是隐性成本。
第三,问题不在 AI 能不能做,而在你有没有帮它选对位置。
一味追求 “全部自动化”,反而更容易出事。
文章参考:数位时代

本文作者:Cheryl
毕业于拉曼大学中文系,曾任新闻记者、文字编辑及节目主持人,后转战营销行业,专注于文案撰写。无论是新闻报道还是品牌营销,都擅长透过文字挖掘深度、传递价值,尤其注重思维启发。希望能透过文字,为读者带来新的视角,拓展认知,让每一次阅读都成为思考的契机。
