全球首位AI程序员来了,编程这条路还好走吗?
00 分钟
2024-3-15
2024-5-1
type
status
title
summary
slug
Created
Mar 15, 2024 02:54 PM
category
tags
Date
icon
password
相信最近大家应该都被全球首位AI程序员Devin刷屏了,那么这位AI程序员到底是何方神圣,它到底能不能替代人类程序员呢,程序员们还能不能保住自己的饭碗呢?接下来为你揭晓答案。
 

一、什么是Devin

Devin是美国初创科技公司 Cognition 推出的(虽然是初创,但团队有10个IOI),世界上第一位能够通过单一提示进行编码、创建网站和软件的人工智能软件工程师,旨在与人类工程师一起工作。
 
Devin不仅能像其他大模型一样给出建议,而且能独立完成整个软件项目,从接受用户需求到编码和应用上线。(真的就是有点人类程序员那味了)
 
而且Devin有自己的代码编辑器、命令行,甚至有自己的浏览器!为什么会有浏览器呢?因为它会使用这个浏览器像人类一样查找资料,然后编程!而且他会将要解决的问题拆分一个循序渐进的计划,并一步步付诸实践,甚至比人类工程师要井井有条!据说Devin可以规划和执行涉及数百到数千个决策的复杂工程项目。
 
目前官方也出了一个演示视频,可以看到人类输入指令后,整个局面就由Devin全面操控了。先是创建项目、然后浏览器查找资料、学习并编码实现,再到出现Bug、打日志调试、解决并发布上线,整个过程一气呵成。
 
这里我也贴心的为大家加了中文字幕,如果感兴趣的可以看看
Video preview
 

二、Devin的核心能力

1、端到端构建和部署程序
Devin不再是像其他大模型那样,单纯地提供建议,或者完成一些小功能,而是像一个程序员一样能够独立管理整个软件开发项目,处理复杂决策。他不再是只能处理单个方面的问题,而是能负责整个工作流!
 
2、持续学习并自我修正
这是让我觉得比较惊艳的一点,他不仅能像其他程序员上网学习新知识,并且将学习到的新知识进行编码实践,还能在出现问题之后进行Debug调试,简直就像一个永不满足的学习者,或者用现在的话说就是:全球卷王!
 
3、拥有集成开发环境
这也是和其他大模型的不同点之一,Devin像人类程序员一样拥有代码编辑器、命令行、浏览器,相信在不久的未来他还会拥有更多工具。
 
4、训练和微调自己的AI模型
除了能够完成普通的网站开发,Devin还有能力帮助人类训练和微调其他AI。对于一些常见的模型(比如视频中的Llama),用户只需要在promot中提及模型的名称,Devin就直接知道要训练哪个模型。
总而言之,Devin给我的最大感觉就是他开始与其他大模型不一样了,不再是一个个冷冰冰的机器人,开始像一个人类程序员一样,或者说像我们的同事一样。试问一下,如果上面的介绍视频,换个标题,换个人类音频,会不会让人以为这就是一个真的程序员在教你编程?
 

三、Devin的优秀案例

1、学会在图片中嵌入文本
Cognition 公司官网博客,有一个视频介绍了一位工程师提供了一篇在图片嵌入文本的博客,然后Devin就开始学习并在最后成功给出了两张嵌入了文本的图片
notion image
注:上面的图片嵌入了 SARA 文本
 
2、解决真实问题的正确概率达到13.86%
在网上有一个SWE-Bench 基准,这个是一个针对 GitHub 上发现的实际软件问题评估大型语言模型的基准。这个基准包含了2,294 个软件工程问题,并且是从真实的 GitHub 问题及其相应的拉取请求中提取的。
 
而目前 Devin 在没有任何帮助的情况下正确解决了 13.86% 的问题,遥遥领先其他AI模型(当然这里可能也有些稍微夸张了,毕竟里面没有刚出的Claude3,而且GPT-4也没说是用几K的模型)
notion image
 
3、在Upwork上完成真实工作任务
Upwork是目前全球最大的综合类自由职业平台,汇集了世界各地的自由职业者和企业。 在这个平台上,你可以找到各种各样的项目,涵盖了设计、开发、翻译、写作、市场营销等多个领域。
 
Cognition公司发表的案例中,Devin在Upwork上接受了真实的工作任务,编写和调试了运行计算机视觉模型的代码。它不仅完成了代码编写,还对生成的数据进行了采样分析,并最终编制了详细报告,展现了其在实际工作场景中的应用能力。
 
Devin的优秀案例远不止这些,如果你对Devin的实际工作感兴趣,可以看官方博客进一步了解
 

四、Devin带来的感触

首先给我的第一个感触就是AI发展实在太快了,而且也越来越像人了,如果你不坐在他对面,你有可能真的意识不到他是个机器人。
 
第二个关于能否代替程序员的问题,其实从上面可以看到,AI能做的事情变得越来越复杂,所以后面一些重复性的,简单的,或者比较固定的任务肯定会被AI慢慢取代,当然这也需要一个过程。
 
当然,目前大部分互联网公司都存在各种屎山,程序员还得和产品进行扯皮,这个目前AI还办不到,但后续互联网公司肯定会不断引进AI,利用AI替代一些比较基础工作,实现降本增效。所以后面对程序员的压力肯定是会变得越来越大的,学会和AI打交道,做同事也许是一门新的技术活!
 
第三点就是AI对个人的帮助,互联网在早期的时候依靠单打独斗其实也能出一个比较好的成绩,但是随着后面的不断发展,复杂性越来越高,单打独斗早已成为过去式,更多是机器流水式的配合,但AI的出现,个人能做的事情其实变多了,未来单打独斗的模式或许能重新焕发生机。
 
最后一点就是AI的成本,AI是依靠庞大的算力的,目前可能是各种AI公司抢市场的阶段,所以大家可能感觉不到AI的昂贵,但如果你用过ChatGPT的API,也许能体会到一点,所以后面会不会由于成本问题又倒逼普通用户不使用AI呢?
 
以上就是我对Devin的一些简单介绍,以及自己的一些思考,希望能帮到大家!
 
我是AI技术巫,欢迎关注我,掌握第一手AI资讯与技巧!
notion image