美国当选总统特朗普威胁说,如果丹麦官员不配合他接管格陵兰岛的提议,他会针对丹麦征收非常高的关税。
图为Cognition的首席执行官Scott Wu
Rashi Shrivastava、Richard Nieva
■
在一次招聘活动中,Cognition的首席执行官Scott Wu给求职者们出了道题,看他们能否比AI更快地算出平方数。他说:“如果你做得比Devin还好,那就来和Cognition团队谈谈吧,看我们有没有什么工作适合你。”
获得2亿美元融资后,28岁的Scott Wu和他极富好胜心的Cognition编程团队正努力打造一款人工智能(AI)工具,让它能像 “一支初级工程师军队”一样完全自主编程。
2023年圣诞节前夕,这家旧金山AI初创公司的一支小团队尝试为公司的编程助手Devin设置一台特别复杂的数据服务器,但进展不顺。他们花了好几个小时翻阅安装文档、尝试不同的命令,但始终无法让服务器正常工作。他们疲惫不堪,心生沮丧,决定看Devin自己会如何处理这个问题。
这个AI工具开始运作后,它的开发者们困惑不已。“它运行了一些看起来就像是巫术或黑魔法的命令。”21岁的联合创始人兼首席产品官Walden Yan回忆道。起初,Devin似乎并没有比他们做得更好。但片刻后,长时间都是红色的服务器终端指示灯变成了绿色。服务器终于成功启动了。
他们意识到,Devin删除了团队没有注意到的一个错误系统文件。“那一刻,我真切地感受到软件工程将会发生怎样的变化。”Yan说。
这是Devin完成的第一个重大任务,也证明Cognition对AI的构想是成立的——让它来代劳编程工作中枯燥乏味的苦差。
现在,时间已快过去一年,Devin已能处理一些基本的编程任务,如发现并修复漏洞、更新代码以及在不同平台间迁移代码。只要给它一个简单的指令,例如“清理这个代码库”,它就能制定出执行计划并付诸实践。大多数时候,它都能顺利完成任务。
在AI编程这个方兴未艾的领域中,也有比Devin更知名、规模更大的参与者,如GitHub(微软在2018年以75亿美元将其收购)和估值13亿美元的Codeium,两者都提供数字助手,可帮助人们根据AI的建议编写代码。
Devin则采取了一种不同的方法。它是一款完全自主的AI智能体,理论上可以独立编写代码,无需人工介入,并且能够完成通常由开发人员承担的完整项目(“Devin”这个名字源于“dev”,即“developer”的缩写)。Cognition的联合创始人兼首席执行官Scott Wu表示:“我们看到了一个真正的机会。我们可以从文本补全再进一步,转向完成整个任务。”
AI生成的代码已经开始重新塑造整个行业了。
10月,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示,谷歌超过四分之一的新代码是由AI编写的。7月,微软首席执行官萨提亚·纳德拉(Satya Nadella)称,2024年GitHub年化收入突破20亿美元,其代码补全工具贡献了40%的收入增长。Pitchbook分析师布伦丹·伯克(Brendan Burke)说,AI编程已成为生成式AI领域融资最多的应用领域,专注于此的初创公司单在2024年上半年就融资超10亿美元。
“现实中的软件工程就是非常复杂混乱的。”Scott Wu,Cognition首席执行官
实际收入才刚刚显露增势:市场研究公司IDC预计,到2029年,AI编程创造的收入将超过40亿美元。多家AI编程初创公司的年收入已经超过1000万美元。Cognition未透露其具体收入,但公司总裁罗素·卡普兰(Russell Kaplan)表示,Cognition已经签约数十家客户,合同每年的金额通常在六到七位数之间。这个市场的潜力令人兴奋,Anthropic、亚马逊和IBM等巨头以及Poolside(估值30亿美元)和Anysphere(估值4亿美元)等初创公司纷纷推出了自家的编程工具。
IDC分析师里图·乔蒂(Ritu Jyoti)表示,能够编写代码已成为一般AI模型“上牌桌的基本要求”,他指出,该领域的领导者仍是OpenAI的ChatGPT。但像Cognition开发的那种可以完全自主工作的编程AI“将会为行业带来天翻地覆的变化”。
不过,这对美国500万名程序员来说可能不是什么好消息(他们的年薪中位数为13万美元),对印度和中国的1300万程序员来说更谈不上喜讯。Wu坚称,程序员大规模失业并不会很快发生,再者编程领域的就业本就已受“供给上限”制约。
程序员们可能会如坐针毡,投资者对这样的变化却喜闻乐见。彼得·蒂尔(Peter Thiel)的创始人基金(Founders Fund)和Khosla Ventures押宝Wu和他的25人团队,4月在Cognition的B轮融资为其注入1.76亿美元,将公司估值推高至20亿美元。此次注资距Cognition成立才过去六个月,距其1月完成2100万美元A轮融资才过去三个月。
Cognition的客户包括年收入3亿美元的支出管理公司Ramp,它用Devin编写测试代码并清理死代码;另一个客户是年收入17亿美元的数据平台MongoDB,其首席产品官萨希尔·阿扎姆(Sahir Azam)表示,公司用Devin更新过时的代码架构,为客户节省了数百万美元。年收入80亿美元的金融科技公司Nubank的程序员也在使用Devin来完成更新代码库等任务。
尽管Cognition才刚起步,前路还很漫长,但创始人基金的合伙人约翰·卢蒂格(John Luttig)仍决定向其投资,原因之一是他觉得Cognition先发优势明显,“其他人要在编程智能体方面赶上他们会十分困难”。微软似乎也有类似的预感。它在5月与Cognition达成合作协议,将Devin部署在Azure云平台上,供开发人员使用。微软首席技术官凯文·斯柯特(Kevin Scott)在公司年度开发者大会上盛赞Devin是一款“非凡”的工具。
然而,硅谷满是曾经领先亚马逊和谷歌,却最终折戟的公司。Cognition的支持者赌的是,如果有谁能够创造出终极的编程机器,那就是三位有重磅奖项加持的世界级“码农”。
Cognition的这三位创始人都是奥林匹克竞赛的金牌获得者,相识于编程领域的竞赛中。
Wu小时候就展露出数学天分,在程序员社交及编程比赛网站Codeforces上达到了代表最高等级的“传奇大师”级别。Cognition的天使投资人、Ramp的首席执行官埃里克·格莱曼(Eric Glyman)表示,Wu的智商在他见过的人中“能排进前五”。
“斯科特显然非常聪明,好奇心旺盛,而且雄心勃勃。”风险投资人郭睿(Sarah Guo)说。她通过自己的公司Conviction参与了Cognition的三轮融资。Wu还曾在2019年作为Lunchclub的创始人而入选《福布斯》“30 Under 30”榜单。Lunchclub利用AI协助用户安排会面、拓展人脉,一位Cognition的投资者告诉《福布斯》,Wu于2022年离开Lunchclub,因为他的兴趣转向了其他地方(Wu拒绝对此置评)。Lunchclub目前已筹资约3000万美元,仍在继续运营。
Cognition在3月推出了Devin,引发大量关注。
公司在X上发布的演示视频累计观看量已达3000万次,称Devin“成功通过了领先AI公司现实中的工程面试”,并完成了复杂的编程任务。一些工程师被Devin的技术实力震惊,其他人则担心自己会碗饭不保。Devin发布后不久,Wu小学七年级在一场数学竞赛中横扫全场的视频被翻出,网友们开玩笑说,“他不是人,而是个AI。”他们还说,“Devin其实就是Scott用消息应用回答你的问题。”
然而,得克萨斯州奥斯汀的著名独立开发者卡尔·布朗(Carl Brown)提出了质疑。他发布了一则名为《“扒皮”Devin》的视频,观看量超50万次。他指出Cognition在宣传其“AI工程师”的能力时夸大其词。他在评测中发现,Devin完成任务的时间远超过人类,过程中还出现了错误。
类似的使用体验促使一些人质疑Devin是否只是把AI泡沫吹得更大了。
数据标注公司Labelbox的工程师克里什·马奈尔(Krish Manair)曾测试过Devin的网页应用创建能力,让它设计一个让人眼前一亮的用户界面,但它给出的结果却十分乏味。
一些竞争对手公司的创始人告诉《福布斯》,他们认为Cognition对Devin的能力做出了不切实际的承诺,让人误以为工程师可以直接拿Devin来编写任何代码。他们认为,Devin目前的能力范围要狭窄得多,更侧重于清理现有代码之类的预定义任务。在一次现场演示中,《福布斯》让Devin构建一款用来给吉他调音的应用。它大约用了10分钟完成,但该应用无法正确识别用来测试的音符,Cognition的几位创始人也不清楚原因。竞争对手、编程初创公司Codeium首席执行官瓦伦·莫汉(Varun Mohan)表示:
Wu承认Devin远谈不上完美。
他在俯瞰旧金山湾区的创始人基金总部表示。“人类一直都在写有漏洞的东西。”而且,说句公道话,多位批评者也对这款工具的能力也表示认可。
Wu表示,Devin发布七个月以来已取得显著改善,一定程度上要归功于早期企业客户的反馈,他们似乎接受了这个智能体是个需要不断改进的产品。Nubank首席技术官维克多·奥利维耶(Vitor Olivier)说:“我们并不指望这个工具会有多么神奇的效果。我们对它持谨慎乐观的态度。”他说,在某些案例中,使用Devin的工程师工作效率提高了八倍。
Cognition还在继续尝试和探索。
去年早些时候,它给Devin添加了启动下属AI为自己提供辅助的功能。然而,当Cognition测试这个新的“管理者”模式时,它发现Devin确实启动了下属AI,但这些下属又启动了更多的下属,形成了一个庞大的、永无止境的AI官僚主义怪圈。“最终我们不得不取消任务,因为它们会不断地把工作委派下去。”卡普兰表示。
不过,卡普兰指出,当多个Devin像“一支初级工程师军队”那样同时进行不同项目时,效果最好。卡普兰的这个描述可能会让一些以编程为生的人不安。Wu表示,Cognition之所以引发了些许负面情绪,一定程度上是因为人们不知AI是否会抢走软件工程岗位,因而感到焦虑。他认为,Devin可以帮助公司承担更多的项目,公司也就能雇用人类员工去做更有意义的工作。
“外界确实有很多担忧,”他说。“人们有很多疑问,不知新范式下会发生什么。”
获得2亿美元融资后,28岁的Scott Wu和他极富好胜心的Cognition编程团队正努力打造一款人工智能(AI)工具,让它能像 “一支初级工程师军队”一样完全自主编程。
2023年圣诞节前夕,这家旧金山AI初创公司的一支小团队尝试为公司的编程助手Devin设置一台特别复杂的数据服务器,但进展不顺。他们花了好几个小时翻阅安装文档、尝试不同的命令,但始终无法让服务器正常工作。他们疲惫不堪,心生沮丧,决定看Devin自己会如何处理这个问题。
这个AI工具开始运作后,它的开发者们困惑不已。“它运行了一些看起来就像是巫术或黑魔法的命令。”21岁的联合创始人兼首席产品官Walden Yan回忆道。起初,Devin似乎并没有比他们做得更好。但片刻后,长时间都是红色的服务器终端指示灯变成了绿色。服务器终于成功启动了。
他们意识到,Devin删除了团队没有注意到的一个错误系统文件。“那一刻,我真切地感受到软件工程将会发生怎样的变化。”Yan说。
这是Devin完成的第一个重大任务,也证明Cognition对AI的构想是成立的——让它来代劳编程工作中枯燥乏味的苦差。
现在,时间已快过去一年,Devin已能处理一些基本的编程任务,如发现并修复漏洞、更新代码以及在不同平台间迁移代码。只要给它一个简单的指令,例如“清理这个代码库”,它就能制定出执行计划并付诸实践。大多数时候,它都能顺利完成任务。
在AI编程这个方兴未艾的领域中,也有比Devin更知名、规模更大的参与者,如GitHub(微软在2018年以75亿美元将其收购)和估值13亿美元的Codeium,两者都提供数字助手,可帮助人们根据AI的建议编写代码。
Devin则采取了一种不同的方法。它是一款完全自主的AI智能体,理论上可以独立编写代码,无需人工介入,并且能够完成通常由开发人员承担的完整项目(“Devin”这个名字源于“dev”,即“developer”的缩写)。Cognition的联合创始人兼首席执行官Scott Wu表示:“我们看到了一个真正的机会。我们可以从文本补全再进一步,转向完成整个任务。”
AI生成的代码已经开始重新塑造整个行业了。
10月,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示,谷歌超过四分之一的新代码是由AI编写的。7月,微软首席执行官萨提亚·纳德拉(Satya Nadella)称,2024年GitHub年化收入突破20亿美元,其代码补全工具贡献了40%的收入增长。Pitchbook分析师布伦丹·伯克(Brendan Burke)说,AI编程已成为生成式AI领域融资最多的应用领域,专注于此的初创公司单在2024年上半年就融资超10亿美元。
“现实中的软件工程就是非常复杂混乱的。”Scott Wu,Cognition首席执行官
实际收入才刚刚显露增势:市场研究公司IDC预计,到2029年,AI编程创造的收入将超过40亿美元。多家AI编程初创公司的年收入已经超过1000万美元。Cognition未透露其具体收入,但公司总裁罗素·卡普兰(Russell Kaplan)表示,Cognition已经签约数十家客户,合同每年的金额通常在六到七位数之间。这个市场的潜力令人兴奋,Anthropic、亚马逊和IBM等巨头以及Poolside(估值30亿美元)和Anysphere(估值4亿美元)等初创公司纷纷推出了自家的编程工具。
IDC分析师里图·乔蒂(Ritu Jyoti)表示,能够编写代码已成为一般AI模型“上牌桌的基本要求”,他指出,该领域的领导者仍是OpenAI的ChatGPT。但像Cognition开发的那种可以完全自主工作的编程AI“将会为行业带来天翻地覆的变化”。
不过,这对美国500万名程序员来说可能不是什么好消息(他们的年薪中位数为13万美元),对印度和中国的1300万程序员来说更谈不上喜讯。Wu坚称,程序员大规模失业并不会很快发生,再者编程领域的就业本就已受“供给上限”制约。
程序员们可能会如坐针毡,投资者对这样的变化却喜闻乐见。彼得·蒂尔(Peter Thiel)的创始人基金(Founders Fund)和Khosla Ventures押宝Wu和他的25人团队,4月在Cognition的B轮融资为其注入1.76亿美元,将公司估值推高至20亿美元。此次注资距Cognition成立才过去六个月,距其1月完成2100万美元A轮融资才过去三个月。
Cognition的客户包括年收入3亿美元的支出管理公司Ramp,它用Devin编写测试代码并清理死代码;另一个客户是年收入17亿美元的数据平台MongoDB,其首席产品官萨希尔·阿扎姆(Sahir Azam)表示,公司用Devin更新过时的代码架构,为客户节省了数百万美元。年收入80亿美元的金融科技公司Nubank的程序员也在使用Devin来完成更新代码库等任务。
尽管Cognition才刚起步,前路还很漫长,但创始人基金的合伙人约翰·卢蒂格(John Luttig)仍决定向其投资,原因之一是他觉得Cognition先发优势明显,“其他人要在编程智能体方面赶上他们会十分困难”。微软似乎也有类似的预感。它在5月与Cognition达成合作协议,将Devin部署在Azure云平台上,供开发人员使用。微软首席技术官凯文·斯柯特(Kevin Scott)在公司年度开发者大会上盛赞Devin是一款“非凡”的工具。
然而,硅谷满是曾经领先亚马逊和谷歌,却最终折戟的公司。Cognition的支持者赌的是,如果有谁能够创造出终极的编程机器,那就是三位有重磅奖项加持的世界级“码农”。
Cognition的这三位创始人都是奥林匹克竞赛的金牌获得者,相识于编程领域的竞赛中。
Wu小时候就展露出数学天分,在程序员社交及编程比赛网站Codeforces上达到了代表最高等级的“传奇大师”级别。Cognition的天使投资人、Ramp的首席执行官埃里克·格莱曼(Eric Glyman)表示,Wu的智商在他见过的人中“能排进前五”。
“斯科特显然非常聪明,好奇心旺盛,而且雄心勃勃。”风险投资人郭睿(Sarah Guo)说。她通过自己的公司Conviction参与了Cognition的三轮融资。Wu还曾在2019年作为Lunchclub的创始人而入选《福布斯》“30 Under 30”榜单。Lunchclub利用AI协助用户安排会面、拓展人脉,一位Cognition的投资者告诉《福布斯》,Wu于2022年离开Lunchclub,因为他的兴趣转向了其他地方(Wu拒绝对此置评)。Lunchclub目前已筹资约3000万美元,仍在继续运营。
Cognition在3月推出了Devin,引发大量关注。
公司在X上发布的演示视频累计观看量已达3000万次,称Devin“成功通过了领先AI公司现实中的工程面试”,并完成了复杂的编程任务。一些工程师被Devin的技术实力震惊,其他人则担心自己会碗饭不保。Devin发布后不久,Wu小学七年级在一场数学竞赛中横扫全场的视频被翻出,网友们开玩笑说,“他不是人,而是个AI。”他们还说,“Devin其实就是Scott用消息应用回答你的问题。”
然而,得克萨斯州奥斯汀的著名独立开发者卡尔·布朗(Carl Brown)提出了质疑。他发布了一则名为《“扒皮”Devin》的视频,观看量超50万次。他指出Cognition在宣传其“AI工程师”的能力时夸大其词。他在评测中发现,Devin完成任务的时间远超过人类,过程中还出现了错误。
类似的使用体验促使一些人质疑Devin是否只是把AI泡沫吹得更大了。
数据标注公司Labelbox的工程师克里什·马奈尔(Krish Manair)曾测试过Devin的网页应用创建能力,让它设计一个让人眼前一亮的用户界面,但它给出的结果却十分乏味。
一些竞争对手公司的创始人告诉《福布斯》,他们认为Cognition对Devin的能力做出了不切实际的承诺,让人误以为工程师可以直接拿Devin来编写任何代码。他们认为,Devin目前的能力范围要狭窄得多,更侧重于清理现有代码之类的预定义任务。在一次现场演示中,《福布斯》让Devin构建一款用来给吉他调音的应用。它大约用了10分钟完成,但该应用无法正确识别用来测试的音符,Cognition的几位创始人也不清楚原因。竞争对手、编程初创公司Codeium首席执行官瓦伦·莫汉(Varun Mohan)表示:
Wu承认Devin远谈不上完美。
他在俯瞰旧金山湾区的创始人基金总部表示。“人类一直都在写有漏洞的东西。”而且,说句公道话,多位批评者也对这款工具的能力也表示认可。
Wu表示,Devin发布七个月以来已取得显著改善,一定程度上要归功于早期企业客户的反馈,他们似乎接受了这个智能体是个需要不断改进的产品。Nubank首席技术官维克多·奥利维耶(Vitor Olivier)说:“我们并不指望这个工具会有多么神奇的效果。我们对它持谨慎乐观的态度。”他说,在某些案例中,使用Devin的工程师工作效率提高了八倍。
Cognition还在继续尝试和探索。
去年早些时候,它给Devin添加了启动下属AI为自己提供辅助的功能。然而,当Cognition测试这个新的“管理者”模式时,它发现Devin确实启动了下属AI,但这些下属又启动了更多的下属,形成了一个庞大的、永无止境的AI官僚主义怪圈。“最终我们不得不取消任务,因为它们会不断地把工作委派下去。”卡普兰表示。
不过,卡普兰指出,当多个Devin像“一支初级工程师军队”那样同时进行不同项目时,效果最好。卡普兰的这个描述可能会让一些以编程为生的人不安。Wu表示,Cognition之所以引发了些许负面情绪,一定程度上是因为人们不知AI是否会抢走软件工程岗位,因而感到焦虑。他认为,Devin可以帮助公司承担更多的项目,公司也就能雇用人类员工去做更有意义的工作。
“外界确实有很多担忧,”他说。“人们有很多疑问,不知新范式下会发生什么。”
■
读者评论
MORE +
热门排行榜
OR
+
图为Cognition的首席执行官Scott Wu
Rashi Shrivastava、Richard Nieva
■
在一次招聘活动中,Cognition的首席执行官Scott Wu给求职者们出了道题,看他们能否比AI更快地算出平方数。他说:“如果你做得比Devin还好,那就来和Cognition团队谈谈吧,看我们有没有什么工作适合你。”
获得2亿美元融资后,28岁的Scott Wu和他极富好胜心的Cognition编程团队正努力打造一款人工智能(AI)工具,让它能像 “一支初级工程师军队”一样完全自主编程。
2023年圣诞节前夕,这家旧金山AI初创公司的一支小团队尝试为公司的编程助手Devin设置一台特别复杂的数据服务器,但进展不顺。他们花了好几个小时翻阅安装文档、尝试不同的命令,但始终无法让服务器正常工作。他们疲惫不堪,心生沮丧,决定看Devin自己会如何处理这个问题。
这个AI工具开始运作后,它的开发者们困惑不已。“它运行了一些看起来就像是巫术或黑魔法的命令。”21岁的联合创始人兼首席产品官Walden Yan回忆道。起初,Devin似乎并没有比他们做得更好。但片刻后,长时间都是红色的服务器终端指示灯变成了绿色。服务器终于成功启动了。
他们意识到,Devin删除了团队没有注意到的一个错误系统文件。“那一刻,我真切地感受到软件工程将会发生怎样的变化。”Yan说。
这是Devin完成的第一个重大任务,也证明Cognition对AI的构想是成立的——让它来代劳编程工作中枯燥乏味的苦差。
现在,时间已快过去一年,Devin已能处理一些基本的编程任务,如发现并修复漏洞、更新代码以及在不同平台间迁移代码。只要给它一个简单的指令,例如“清理这个代码库”,它就能制定出执行计划并付诸实践。大多数时候,它都能顺利完成任务。
在AI编程这个方兴未艾的领域中,也有比Devin更知名、规模更大的参与者,如GitHub(微软在2018年以75亿美元将其收购)和估值13亿美元的Codeium,两者都提供数字助手,可帮助人们根据AI的建议编写代码。
Devin则采取了一种不同的方法。它是一款完全自主的AI智能体,理论上可以独立编写代码,无需人工介入,并且能够完成通常由开发人员承担的完整项目(“Devin”这个名字源于“dev”,即“developer”的缩写)。Cognition的联合创始人兼首席执行官Scott Wu表示:“我们看到了一个真正的机会。我们可以从文本补全再进一步,转向完成整个任务。”
AI生成的代码已经开始重新塑造整个行业了。
10月,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示,谷歌超过四分之一的新代码是由AI编写的。7月,微软首席执行官萨提亚·纳德拉(Satya Nadella)称,2024年GitHub年化收入突破20亿美元,其代码补全工具贡献了40%的收入增长。Pitchbook分析师布伦丹·伯克(Brendan Burke)说,AI编程已成为生成式AI领域融资最多的应用领域,专注于此的初创公司单在2024年上半年就融资超10亿美元。
“现实中的软件工程就是非常复杂混乱的。”Scott Wu,Cognition首席执行官
实际收入才刚刚显露增势:市场研究公司IDC预计,到2029年,AI编程创造的收入将超过40亿美元。多家AI编程初创公司的年收入已经超过1000万美元。Cognition未透露其具体收入,但公司总裁罗素·卡普兰(Russell Kaplan)表示,Cognition已经签约数十家客户,合同每年的金额通常在六到七位数之间。这个市场的潜力令人兴奋,Anthropic、亚马逊和IBM等巨头以及Poolside(估值30亿美元)和Anysphere(估值4亿美元)等初创公司纷纷推出了自家的编程工具。
IDC分析师里图·乔蒂(Ritu Jyoti)表示,能够编写代码已成为一般AI模型“上牌桌的基本要求”,他指出,该领域的领导者仍是OpenAI的ChatGPT。但像Cognition开发的那种可以完全自主工作的编程AI“将会为行业带来天翻地覆的变化”。
不过,这对美国500万名程序员来说可能不是什么好消息(他们的年薪中位数为13万美元),对印度和中国的1300万程序员来说更谈不上喜讯。Wu坚称,程序员大规模失业并不会很快发生,再者编程领域的就业本就已受“供给上限”制约。
程序员们可能会如坐针毡,投资者对这样的变化却喜闻乐见。彼得·蒂尔(Peter Thiel)的创始人基金(Founders Fund)和Khosla Ventures押宝Wu和他的25人团队,4月在Cognition的B轮融资为其注入1.76亿美元,将公司估值推高至20亿美元。此次注资距Cognition成立才过去六个月,距其1月完成2100万美元A轮融资才过去三个月。
Cognition的客户包括年收入3亿美元的支出管理公司Ramp,它用Devin编写测试代码并清理死代码;另一个客户是年收入17亿美元的数据平台MongoDB,其首席产品官萨希尔·阿扎姆(Sahir Azam)表示,公司用Devin更新过时的代码架构,为客户节省了数百万美元。年收入80亿美元的金融科技公司Nubank的程序员也在使用Devin来完成更新代码库等任务。
尽管Cognition才刚起步,前路还很漫长,但创始人基金的合伙人约翰·卢蒂格(John Luttig)仍决定向其投资,原因之一是他觉得Cognition先发优势明显,“其他人要在编程智能体方面赶上他们会十分困难”。微软似乎也有类似的预感。它在5月与Cognition达成合作协议,将Devin部署在Azure云平台上,供开发人员使用。微软首席技术官凯文·斯柯特(Kevin Scott)在公司年度开发者大会上盛赞Devin是一款“非凡”的工具。
然而,硅谷满是曾经领先亚马逊和谷歌,却最终折戟的公司。Cognition的支持者赌的是,如果有谁能够创造出终极的编程机器,那就是三位有重磅奖项加持的世界级“码农”。
Cognition的这三位创始人都是奥林匹克竞赛的金牌获得者,相识于编程领域的竞赛中。
Wu小时候就展露出数学天分,在程序员社交及编程比赛网站Codeforces上达到了代表最高等级的“传奇大师”级别。Cognition的天使投资人、Ramp的首席执行官埃里克·格莱曼(Eric Glyman)表示,Wu的智商在他见过的人中“能排进前五”。
“斯科特显然非常聪明,好奇心旺盛,而且雄心勃勃。”风险投资人郭睿(Sarah Guo)说。她通过自己的公司Conviction参与了Cognition的三轮融资。Wu还曾在2019年作为Lunchclub的创始人而入选《福布斯》“30 Under 30”榜单。Lunchclub利用AI协助用户安排会面、拓展人脉,一位Cognition的投资者告诉《福布斯》,Wu于2022年离开Lunchclub,因为他的兴趣转向了其他地方(Wu拒绝对此置评)。Lunchclub目前已筹资约3000万美元,仍在继续运营。
Cognition在3月推出了Devin,引发大量关注。
公司在X上发布的演示视频累计观看量已达3000万次,称Devin“成功通过了领先AI公司现实中的工程面试”,并完成了复杂的编程任务。一些工程师被Devin的技术实力震惊,其他人则担心自己会碗饭不保。Devin发布后不久,Wu小学七年级在一场数学竞赛中横扫全场的视频被翻出,网友们开玩笑说,“他不是人,而是个AI。”他们还说,“Devin其实就是Scott用消息应用回答你的问题。”
然而,得克萨斯州奥斯汀的著名独立开发者卡尔·布朗(Carl Brown)提出了质疑。他发布了一则名为《“扒皮”Devin》的视频,观看量超50万次。他指出Cognition在宣传其“AI工程师”的能力时夸大其词。他在评测中发现,Devin完成任务的时间远超过人类,过程中还出现了错误。
类似的使用体验促使一些人质疑Devin是否只是把AI泡沫吹得更大了。
数据标注公司Labelbox的工程师克里什·马奈尔(Krish Manair)曾测试过Devin的网页应用创建能力,让它设计一个让人眼前一亮的用户界面,但它给出的结果却十分乏味。
一些竞争对手公司的创始人告诉《福布斯》,他们认为Cognition对Devin的能力做出了不切实际的承诺,让人误以为工程师可以直接拿Devin来编写任何代码。他们认为,Devin目前的能力范围要狭窄得多,更侧重于清理现有代码之类的预定义任务。在一次现场演示中,《福布斯》让Devin构建一款用来给吉他调音的应用。它大约用了10分钟完成,但该应用无法正确识别用来测试的音符,Cognition的几位创始人也不清楚原因。竞争对手、编程初创公司Codeium首席执行官瓦伦·莫汉(Varun Mohan)表示:
Wu承认Devin远谈不上完美。
他在俯瞰旧金山湾区的创始人基金总部表示。“人类一直都在写有漏洞的东西。”而且,说句公道话,多位批评者也对这款工具的能力也表示认可。
Wu表示,Devin发布七个月以来已取得显著改善,一定程度上要归功于早期企业客户的反馈,他们似乎接受了这个智能体是个需要不断改进的产品。Nubank首席技术官维克多·奥利维耶(Vitor Olivier)说:“我们并不指望这个工具会有多么神奇的效果。我们对它持谨慎乐观的态度。”他说,在某些案例中,使用Devin的工程师工作效率提高了八倍。
Cognition还在继续尝试和探索。
去年早些时候,它给Devin添加了启动下属AI为自己提供辅助的功能。然而,当Cognition测试这个新的“管理者”模式时,它发现Devin确实启动了下属AI,但这些下属又启动了更多的下属,形成了一个庞大的、永无止境的AI官僚主义怪圈。“最终我们不得不取消任务,因为它们会不断地把工作委派下去。”卡普兰表示。
不过,卡普兰指出,当多个Devin像“一支初级工程师军队”那样同时进行不同项目时,效果最好。卡普兰的这个描述可能会让一些以编程为生的人不安。Wu表示,Cognition之所以引发了些许负面情绪,一定程度上是因为人们不知AI是否会抢走软件工程岗位,因而感到焦虑。他认为,Devin可以帮助公司承担更多的项目,公司也就能雇用人类员工去做更有意义的工作。
“外界确实有很多担忧,”他说。“人们有很多疑问,不知新范式下会发生什么。”
获得2亿美元融资后,28岁的Scott Wu和他极富好胜心的Cognition编程团队正努力打造一款人工智能(AI)工具,让它能像 “一支初级工程师军队”一样完全自主编程。
2023年圣诞节前夕,这家旧金山AI初创公司的一支小团队尝试为公司的编程助手Devin设置一台特别复杂的数据服务器,但进展不顺。他们花了好几个小时翻阅安装文档、尝试不同的命令,但始终无法让服务器正常工作。他们疲惫不堪,心生沮丧,决定看Devin自己会如何处理这个问题。
这个AI工具开始运作后,它的开发者们困惑不已。“它运行了一些看起来就像是巫术或黑魔法的命令。”21岁的联合创始人兼首席产品官Walden Yan回忆道。起初,Devin似乎并没有比他们做得更好。但片刻后,长时间都是红色的服务器终端指示灯变成了绿色。服务器终于成功启动了。
他们意识到,Devin删除了团队没有注意到的一个错误系统文件。“那一刻,我真切地感受到软件工程将会发生怎样的变化。”Yan说。
这是Devin完成的第一个重大任务,也证明Cognition对AI的构想是成立的——让它来代劳编程工作中枯燥乏味的苦差。
现在,时间已快过去一年,Devin已能处理一些基本的编程任务,如发现并修复漏洞、更新代码以及在不同平台间迁移代码。只要给它一个简单的指令,例如“清理这个代码库”,它就能制定出执行计划并付诸实践。大多数时候,它都能顺利完成任务。
在AI编程这个方兴未艾的领域中,也有比Devin更知名、规模更大的参与者,如GitHub(微软在2018年以75亿美元将其收购)和估值13亿美元的Codeium,两者都提供数字助手,可帮助人们根据AI的建议编写代码。
Devin则采取了一种不同的方法。它是一款完全自主的AI智能体,理论上可以独立编写代码,无需人工介入,并且能够完成通常由开发人员承担的完整项目(“Devin”这个名字源于“dev”,即“developer”的缩写)。Cognition的联合创始人兼首席执行官Scott Wu表示:“我们看到了一个真正的机会。我们可以从文本补全再进一步,转向完成整个任务。”
AI生成的代码已经开始重新塑造整个行业了。
10月,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示,谷歌超过四分之一的新代码是由AI编写的。7月,微软首席执行官萨提亚·纳德拉(Satya Nadella)称,2024年GitHub年化收入突破20亿美元,其代码补全工具贡献了40%的收入增长。Pitchbook分析师布伦丹·伯克(Brendan Burke)说,AI编程已成为生成式AI领域融资最多的应用领域,专注于此的初创公司单在2024年上半年就融资超10亿美元。
“现实中的软件工程就是非常复杂混乱的。”Scott Wu,Cognition首席执行官
实际收入才刚刚显露增势:市场研究公司IDC预计,到2029年,AI编程创造的收入将超过40亿美元。多家AI编程初创公司的年收入已经超过1000万美元。Cognition未透露其具体收入,但公司总裁罗素·卡普兰(Russell Kaplan)表示,Cognition已经签约数十家客户,合同每年的金额通常在六到七位数之间。这个市场的潜力令人兴奋,Anthropic、亚马逊和IBM等巨头以及Poolside(估值30亿美元)和Anysphere(估值4亿美元)等初创公司纷纷推出了自家的编程工具。
IDC分析师里图·乔蒂(Ritu Jyoti)表示,能够编写代码已成为一般AI模型“上牌桌的基本要求”,他指出,该领域的领导者仍是OpenAI的ChatGPT。但像Cognition开发的那种可以完全自主工作的编程AI“将会为行业带来天翻地覆的变化”。
不过,这对美国500万名程序员来说可能不是什么好消息(他们的年薪中位数为13万美元),对印度和中国的1300万程序员来说更谈不上喜讯。Wu坚称,程序员大规模失业并不会很快发生,再者编程领域的就业本就已受“供给上限”制约。
程序员们可能会如坐针毡,投资者对这样的变化却喜闻乐见。彼得·蒂尔(Peter Thiel)的创始人基金(Founders Fund)和Khosla Ventures押宝Wu和他的25人团队,4月在Cognition的B轮融资为其注入1.76亿美元,将公司估值推高至20亿美元。此次注资距Cognition成立才过去六个月,距其1月完成2100万美元A轮融资才过去三个月。
Cognition的客户包括年收入3亿美元的支出管理公司Ramp,它用Devin编写测试代码并清理死代码;另一个客户是年收入17亿美元的数据平台MongoDB,其首席产品官萨希尔·阿扎姆(Sahir Azam)表示,公司用Devin更新过时的代码架构,为客户节省了数百万美元。年收入80亿美元的金融科技公司Nubank的程序员也在使用Devin来完成更新代码库等任务。
尽管Cognition才刚起步,前路还很漫长,但创始人基金的合伙人约翰·卢蒂格(John Luttig)仍决定向其投资,原因之一是他觉得Cognition先发优势明显,“其他人要在编程智能体方面赶上他们会十分困难”。微软似乎也有类似的预感。它在5月与Cognition达成合作协议,将Devin部署在Azure云平台上,供开发人员使用。微软首席技术官凯文·斯柯特(Kevin Scott)在公司年度开发者大会上盛赞Devin是一款“非凡”的工具。
然而,硅谷满是曾经领先亚马逊和谷歌,却最终折戟的公司。Cognition的支持者赌的是,如果有谁能够创造出终极的编程机器,那就是三位有重磅奖项加持的世界级“码农”。
Cognition的这三位创始人都是奥林匹克竞赛的金牌获得者,相识于编程领域的竞赛中。
Wu小时候就展露出数学天分,在程序员社交及编程比赛网站Codeforces上达到了代表最高等级的“传奇大师”级别。Cognition的天使投资人、Ramp的首席执行官埃里克·格莱曼(Eric Glyman)表示,Wu的智商在他见过的人中“能排进前五”。
“斯科特显然非常聪明,好奇心旺盛,而且雄心勃勃。”风险投资人郭睿(Sarah Guo)说。她通过自己的公司Conviction参与了Cognition的三轮融资。Wu还曾在2019年作为Lunchclub的创始人而入选《福布斯》“30 Under 30”榜单。Lunchclub利用AI协助用户安排会面、拓展人脉,一位Cognition的投资者告诉《福布斯》,Wu于2022年离开Lunchclub,因为他的兴趣转向了其他地方(Wu拒绝对此置评)。Lunchclub目前已筹资约3000万美元,仍在继续运营。
Cognition在3月推出了Devin,引发大量关注。
公司在X上发布的演示视频累计观看量已达3000万次,称Devin“成功通过了领先AI公司现实中的工程面试”,并完成了复杂的编程任务。一些工程师被Devin的技术实力震惊,其他人则担心自己会碗饭不保。Devin发布后不久,Wu小学七年级在一场数学竞赛中横扫全场的视频被翻出,网友们开玩笑说,“他不是人,而是个AI。”他们还说,“Devin其实就是Scott用消息应用回答你的问题。”
然而,得克萨斯州奥斯汀的著名独立开发者卡尔·布朗(Carl Brown)提出了质疑。他发布了一则名为《“扒皮”Devin》的视频,观看量超50万次。他指出Cognition在宣传其“AI工程师”的能力时夸大其词。他在评测中发现,Devin完成任务的时间远超过人类,过程中还出现了错误。
类似的使用体验促使一些人质疑Devin是否只是把AI泡沫吹得更大了。
数据标注公司Labelbox的工程师克里什·马奈尔(Krish Manair)曾测试过Devin的网页应用创建能力,让它设计一个让人眼前一亮的用户界面,但它给出的结果却十分乏味。
一些竞争对手公司的创始人告诉《福布斯》,他们认为Cognition对Devin的能力做出了不切实际的承诺,让人误以为工程师可以直接拿Devin来编写任何代码。他们认为,Devin目前的能力范围要狭窄得多,更侧重于清理现有代码之类的预定义任务。在一次现场演示中,《福布斯》让Devin构建一款用来给吉他调音的应用。它大约用了10分钟完成,但该应用无法正确识别用来测试的音符,Cognition的几位创始人也不清楚原因。竞争对手、编程初创公司Codeium首席执行官瓦伦·莫汉(Varun Mohan)表示:
Wu承认Devin远谈不上完美。
他在俯瞰旧金山湾区的创始人基金总部表示。“人类一直都在写有漏洞的东西。”而且,说句公道话,多位批评者也对这款工具的能力也表示认可。
Wu表示,Devin发布七个月以来已取得显著改善,一定程度上要归功于早期企业客户的反馈,他们似乎接受了这个智能体是个需要不断改进的产品。Nubank首席技术官维克多·奥利维耶(Vitor Olivier)说:“我们并不指望这个工具会有多么神奇的效果。我们对它持谨慎乐观的态度。”他说,在某些案例中,使用Devin的工程师工作效率提高了八倍。
Cognition还在继续尝试和探索。
去年早些时候,它给Devin添加了启动下属AI为自己提供辅助的功能。然而,当Cognition测试这个新的“管理者”模式时,它发现Devin确实启动了下属AI,但这些下属又启动了更多的下属,形成了一个庞大的、永无止境的AI官僚主义怪圈。“最终我们不得不取消任务,因为它们会不断地把工作委派下去。”卡普兰表示。
不过,卡普兰指出,当多个Devin像“一支初级工程师军队”那样同时进行不同项目时,效果最好。卡普兰的这个描述可能会让一些以编程为生的人不安。Wu表示,Cognition之所以引发了些许负面情绪,一定程度上是因为人们不知AI是否会抢走软件工程岗位,因而感到焦虑。他认为,Devin可以帮助公司承担更多的项目,公司也就能雇用人类员工去做更有意义的工作。
“外界确实有很多担忧,”他说。“人们有很多疑问,不知新范式下会发生什么。”
■
读者评论OR+ 更多
读者评论
OR
+ 更多
分享:
每日头条
OR
+
最新资讯
OR
+
热门排行榜
OR
+
OR品牌理念
+
■ 或者, 留一段影像,回一曲挂牵。丝丝入扣、暖暖心灵 ,需飘过的醇厚与共。
■ 或者,热烈空雨伴芬芳泥土;绿绿生命缠锐意骄阳。
回望,回望,一马平川红酒飘散断归途。
■ 或者,灰蒙蒙空气重回道指一万四千点。滚动时光,照进现实,流逝过往,回归未来。
■ 或者,热烈空雨伴芬芳泥土;绿绿生命缠锐意骄阳。
回望,回望,一马平川红酒飘散断归途。
■ 或者,灰蒙蒙空气重回道指一万四千点。滚动时光,照进现实,流逝过往,回归未来。
■ OR 新媒体是一个提供时政、经济、文化、科技等多领域资讯的平台,旨在为用户提供优质的阅读体验。网站的网址是oror.vip,用户可以通过浏览器在台式电脑 、笔记本电脑 、平板电脑 、手机访问。.......