Agent 和人一样,做事都要遵循科学的方法论。
这个 “Hypothesis->Analytics->Insights->Hypothesis” 的迭代闭环非常重要。Manus 等通用 Agent 产品如果能把这个迭代闭环做好,能力可以提升一大步。中国古代没有发展出现代科学,就是因为缺少假设检验的过程,或者提出的假设难以证伪(比如归因于神)。
人在设计 Agent 的时候,改了一个 prompt 以后,如果没有测试用例,那么 prompt 修改带来的改进就是经验主义的,无法量化改进。Agent 在做调研的时候,如果没有交叉验证,得到的信息也只是猜测,达不到 insight 的程度。
此外,通用 Agent 一定需要 autonomous,不能让模型一开始生成一个 plan 然后就严格遵照执行。因为环境是动态的,需要用 RL 的方法论 trial and error,learn from experience。RL agent 里面 planning 和 execution 是一个反馈闭环。
————
Palantir公司最近加入了S&P 500,股价飙升,市值接近1000亿美元,吸引了风险资本家的投资兴趣。过去,Palantir因为与间谍技术和NSA监控的关联而备受争议,公司形象不佳,甚至在道德上受到质疑。作者曾在Palantir工作八年,离开后决定分享自己的经历和对公司的理解,因为外界对Palantir有很多误解。
对Palantir的反思
发布时间: 2024年10月15日 (Substack链接)
Palantir如今炙手可热。该公司近期入选了标普500指数。股价一路飙升,公司市值逼近1000亿美元。风险投资人争相追逐前Palantir创始人,请求投资。
对于公司的老员工和前员工来说,这感觉非常诡异。尤其是在2016至2020年间,告诉别人你在Palantir工作并不受欢迎。公司被视为间谍技术、NSA监控,甚至更糟。办公室外常有抗议活动。即使是那些在道德上不反对的人,也常把公司贬低为一个伪装成软件公司的咨询公司,或者顶多是一种高级形式的人才套利(talent arbitrage)。
我去年离开了公司,但从未公开写过在那里的见闻。外界对这家公司也有很多不了解的地方。因此,作为一名在那里工作了八年的前员工,我尝试在此解释其中一些方面。
(注:本文仅代表我个人观点,我与公司已无正式关系。我持有$PLTR多头仓位。)
1. 入职初衷
我于2015年夏天加入,最初在新开设的伦敦办公室,后调至硅谷,最后在华盛顿特区——担任前线部署工程师(forward deployed engineer, FDE)。背景是,当时公司大约有1500人;办公室分布在帕洛阿尔托(总部)、纽约、伦敦及其他几个地方。(现在约有4000人,总部设在丹佛。)
我为何加入?
首先,我想在“困难”的行业里,解决真实且有意义的重大问题。由于个人原因,我感兴趣的领域是医疗健康和生物科技,当时公司在这块业务刚刚起步。公司谈论着要在医疗健康、航空航天、制造业、网络安全等我认为非常重要、但当时却鲜有人涉足的行业开展工作。那时最热门的是社交网络(Facebook、LinkedIn、Quora等)和各类消费类应用(Dropbox、Uber、Airbnb),但极少有公司去攻克经济中那些真实、棘手的部分。如果你想投身于经济中这些“更硬核”的领域,同时又想要硅谷式的工作文化,Palantir一度几乎是唯一的选择。
我的目标是创办一家公司,但我希望:(1) 先深入其中一个行业一段时间,了解真实情况;(2) 为一家美国公司工作,以此获得绿卡。Palantir两者都能提供。这让我很容易就做出了选择。
其次,人才密度。我与几位早期开创医疗健康垂直领域的人(Nick Perry、Lekan Wang 和 Andrew Girvin)交流过,印象极其深刻。随后我又与几位早期的业务运营和战略人员进行了面试,更加为之折服。这些人极其专注、充满竞争意识、渴望胜利,是真正的信徒;他们古怪而迷人,业余时间读哲学、尝试奇怪饮食、骑100英里自行车只为乐趣。事实证明,这是“PayPal黑帮”的传承。PayPal的早期成员Yishan Wong曾撰文谈及专注度的重要性:
“总的来说,当我开始考察更多初创公司时,我发现PayPal的人才水平在硅谷初创公司中并不罕见,但关键的区别因素可能是来自高层的专注度:Peter Thiel和Max Levchin都是极其专注的人——超级有竞争性、勤奋工作、绝不接受失败。我认为正是这种领导力,才能推动‘标准’的优秀团队成就伟业,并进而促成后续成就的不断涌现。”
Palantir也是一个异常古怪的地方。我记得第一次与Stephen Cohen交谈时,他办公室的空调设定在60华氏度(约15.5摄氏度),房间里放着几个样子古怪、用于降低二氧化碳含量的设备,杯子里还装了一大堆冰块。整个谈话过程中,他不停地嚼着冰块。(据说这对认知能力有益。)
我也面试过CEO Alex Karp,并与其他高管团队成员交流过。可能无需我多言Karp有多古怪——看看他的采访就知道了。我不能透露Karp和我谈了什么,但他在2012年的一次采访中很好地展现了他的风格:
“我喜欢在没有任何候选人数据的情况下会见他们:没有简历,没有预讨论或职位描述,只有候选人和我在一个房间里。我会问一个相当随机的问题,一个与他们将在Palantir做的任何事都正交的问题。然后我观察他们如何拆解这个问题,看他们是否理解看待同一件事物可以有多种不同的方式。我喜欢把面试时间控制得很短,大约10分钟。否则,人们会进入他们习得的反应模式,你就无法感知他们真实的样子。”
我的面试常常和工作或软件毫无关系——有一次面试,我们花了一个小时只谈论维特根斯坦。请注意,Peter Thiel和Alex Karp都是哲学专业出身。Thiel的课堂笔记在不久之前出版,其中讨论了莎士比亚、托尔斯泰、吉拉德(当时还不知名,现在已是陈词滥调)等等。
这种知识上的宏大抱负与强烈的竞争意识的结合,对我来说是完美的契合。事实上,时至今日这仍然很难找到——许多人模仿了“硬核”工作文化和“这里是海军陆战队”的氛围,但很少有公司拥有那种知识氛围,那种让人感觉置身于丰富思想体系中的感觉。这很难装出来——你的创始人和早期员工必须是真正有趣的思想者。如今能想到完美结合了这两点的公司主要是OpenAI和Anthropic。难怪它们都成了人才磁铁。[1]
2. 前线部署 (Forward Deployed)
我加入时,Palantir的工程师分为两类:
- 与客户合作的工程师,有时称为FDE(前线部署工程师)。
- 核心产品团队(产品开发 – PD)的工程师,他们很少去拜访客户。
FDE通常需要“驻场”到客户办公室,每周在那里工作3-4天,这意味着大量的差旅。这在当时乃至现在,对于一家硅谷公司来说都是极不寻常的。
关于这种模式有很多值得探讨的地方,但其核心理念是:通过深入接触困难行业(制造业、医疗健康、情报、航空航天等)的业务流程,获取细致入微的知识,然后利用这些知识设计真正解决问题的软件。PD工程师则负责将FDE们构建的东西“产品化”,并且更广泛地构建软件,为FDE们提供杠杆,让他们工作得更好更快。[2]
Foundry产品的雏形很大程度上就是这样形成的:FDE去客户现场,不得不手动处理大量繁琐工作,然后PD工程师构建工具来自动化这些繁琐工作。需要从SAP或AWS导入数据?于是有了Magritte(数据摄取工具)。需要可视化数据?于是有了Contour(一个点击式可视化工具)。需要快速搭建一个Web应用?于是有了Workshop(一个类似Retool的Web应用构建UI)。最终,围绕“整合数据并使其发挥作用”这个宽泛主题,形成了一套极其出色的工具集。
当时,让客户直接使用这些工具被视为一个激进的举措——它们尚未达到那种成熟度——但现在这驱动了公司50%以上的收入,它就是Foundry。从这个角度看,Palantir完成了一个罕见的服务型公司向产品型公司的转型:在2016年,将其描述为一家硅谷服务公司并非完全错误,但在2024年,这种描述则大错特错,因为公司成功利用早年积累的经验打造了一个企业数据平台,这体现在其毛利率上——2023年达到了80%。这是软件公司的毛利率水平。相比之下,埃森哲(Accenture)的毛利率是32%。
Tyler Cowen有一句精辟的话:“情境(context)是稀缺之物”,你可以说这是该模式的根本洞见。驻场客户身边——创业导师Steve Blank称之为“走出大楼”——意味着你能捕捉到他们工作方式的隐性知识,而不仅仅是企业软件通常依赖的那种扁平的“需求清单”模型。公司对此深信不疑,达到了一种令人发指的程度:接到某人电话后,订一张次日一早飞往某个极其偏僻地方的机票是家常便饭;“先上飞机,再问问题”是公司的文化偏向。这导致了很长时间内失控的差旅开支——我们中许多人最终都获得了美联航1K或类似的高级会员资格——但这也意味着一个长达十年的高强度学习周期,最终得到了回报。
我真正参与的第一个客户项目是与飞机制造商空中客车(Airbus)合作,我搬到图卢兹待了一年,每周有四天在工厂里和制造人员一起工作,帮助他们构建该地的软件版本。
在图卢兹的第一个月,我周末无法飞离该市,因为空中交通管制员每个周末都在罢工。欢迎来到法国。(我开玩笑的——法国很棒。另外,空客飞机非常棒。它是一家真正以工程为核心的公司。CEO总是训练有素的航空工程师,而不是什么MBA。不像……算了。)
该公司的CEO告诉我们,他最大的问题是扩大A350的生产规模。因此,我们最终构建了软件来直接解决这个问题。我有时将其描述为“Asana,但用于制造飞机”。你将不同的数据源——工作订单、缺失零件、质量问题(“不合格项”)——整合到一个友好的界面中,能够勾选完成的工作,查看其他团队在做什么、零件在哪里、进度如何等等。让他们能够搜索(包括模糊/语义搜索)以前的质量问题并查看如何解决的。这些在某种程度上都是基本的软件功能,但你也见识过企业软件能有多烂——仅仅将这些“最佳实践”的UI部署到现实世界就具有惊人的威力。这最终帮助推动了A350制造的激增,在保持空客高标准质量的同时,成功地将制造速度提高了4倍。
这使得软件很难简洁地描述——它不仅仅是一个数据库或电子表格,它是针对那个特定问题的端到端解决方案,至于通用性(generalizability),见鬼去吧。你的工作是解决问题,不必担心过度拟合(overfitting);PD的工作是把你构建的东西拿去,进行通用化处理,目标是在其他地方销售它。
(此处原有一张A350最终装配线的图片,配文:图卢兹的A350最终装配线。我大部分时间都泡在这里。令人敬畏。截图来源此处。)
FDE们倾向于编写能快速解决问题的代码,这通常意味着——客气地说——技术债和临时性变通方案(hacky workarounds)。PD工程师则编写能够清晰扩展、适用于多种用例且不易崩溃的软件。公司的一个关键“秘诀”在于,创造深厚、可持续的企业价值需要两者兼备。FDE们通常具有高忍耐力、深入嵌入外部公司并赢得客户信任所需的社交和政治技巧,以及高速度——你需要快速构建出能交付核心价值的东西,让客户认识到你是真材实料。客户对大多数软件承包商(他们通常是SAP或其他类似软件的实施者,遵循长达数年的“瀑布式”时间表)的期望低得可笑,这也有帮助。所以,当一个由20多岁年轻人组成的“杂牌军”出现在客户现场,并在几周内构建出人们能用的真实软件时,人们自然会注意到。
这种双管齐下的模式构成了一个强大的引擎。客户团队通常很小(4-5人),运作快速且自主;有很多这样的团队,都在快速学习,而核心产品团队的工作就是吸收这些学习成果,构建主平台。
当我们被允许在一个组织内部工作时,这种模式往往效果很好。障碍主要是政治性的。每次你看到政府又授予德勤(Deloitte)1.1亿美元合同去建一个无法运行的网站,或者发生类似healthcare.gov的灾难,或者旧金山联合学区(SFUSD)花费4000万美元去实施一个——再次——无法运行的薪酬系统时,你看到的就是政治战胜了实质。SpaceX与NASA是另一个例子。
世界需要更多像SpaceX和Palantir这样的公司,它们以执行力——达成结果——而非玩弄政治游戏或构建无法达成目标的狭隘单点解决方案来脱颖而出。
3. 秘诀 (Secrets)
FDE们做的另一项关键工作是数据整合(data integration),这个术语能让大多数人昏昏欲睡。这过去是(现在仍然是)公司业务的核心,多年来其重要性却被大多数观察者低估了。事实上,直到如今随着人工智能(AI)的兴起,人们才开始意识到拥有干净、规范、易于访问的企业数据的重要性。(参见:AI模型中的“它”指的就是数据集)。
简单来说,“数据整合”意味着:(a) 获得企业数据的访问权限,这通常需要与组织内的“数据所有者”进行协商;(b) 清理数据,有时还需要转换数据,使其可用;(c) 将数据放在每个人都能访问的地方。Palantir主要软件平台(Foundry)中的许多基础软件,正是为了使这项任务更容易、更快捷的工具。
数据整合为何如此困难?数据通常以不易被计算机分析的格式存在——PDF、笔记本、Excel文件(天哪,太多Excel文件了)等等。但通常真正的阻碍是组织政治:一个团队或小组控制着关键数据源,他们存在的理由就是成为该数据源的守门人,他们通常也通过充当该数据源的守门人(并且常常提供该数据的分析)来证明自己在公司中的存在价值。[3] 这种政治可能是一个难以克服的巨大障碍,在某些情况下导致了荒谬的结果——一家公司购买了一个8-12周的试点项目,结果我们花了整整8-12周时间只为了获得数据访问权限,最后一周才手忙脚乱地弄出点东西来演示。
Palantir很早就发现的另一个“秘诀”是,数据访问权的争夺部分源于真正的数据安全问题,而这可以通过在平台的数据整合层构建安全控制来缓解——而且是各个层面的控制。这意味着基于角色的访问控制、行级策略、安全标记、审计追踪以及大量其他数据安全功能,这些功能其他公司至今仍在追赶。正因为这些特性,部署Palantir常常使公司的数据更加安全,而非更不安全。[4]
4. 文化笔记 (Notes on Culture)
公司的整体“氛围”更像是一个救世主式的邪教团体(messianic cult),而非一家正常的软件公司。但重要的是,批评似乎被高度容忍甚至欢迎——有人给我看过一个邮件链,一位初级软件工程师与公司的一位总监(Director)进行公开、激烈的争论,整个公司(大约一千人)都在抄送列表里。作为一个理性主义思维主导的哲学毕业生,这一点对我来说至关重要——我对加入一个不加批判的邪教不感兴趣。但是,一个由持怀疑态度的人组成、深切关心并想争论世界走向以及软件在其中如何存在(existentially)的“邪教”——这让我很感兴趣。[5]
我不确定他们现在是否还这样做,但当时你入职时,他们会给你寄送一本《Impro》、一本《巨塔杀机》(The Looming Tower,关于9/11的书)、《Interviewing Users》和《搞定》(Getting Things Done)。我还收到过一份后来成为瑞·达利欧(Ray Dalio)《原则》(Principles)的早期PDF版本。这定下了基调。《巨塔杀机》的意义显而易见——公司成立的部分原因是对9/11事件的回应,也是对Peter所预见的公民自由必将遭受侵犯的回应,其背景很有价值。但为什么要寄《Impro》呢?
成为一名成功的FDE需要对社会情境有不同寻常的敏感度——你真正要做的是与你所在企业(或政府)的最高层对口人员建立伙伴关系并赢得他们的信任,而这常常需要玩弄政治游戏。《Impro》在极客中很受欢迎,部分原因是它将社会行为机制化地分解了。公司的词汇表里充斥着《Impro》式的表达——例如“角色塑造”(casting)。Johnstone讨论了同一个演员如何仅仅通过改变肢体行为就能扮演“高姿态”或“低姿态”——例如,讲话时保持头部不动是高姿态,而频繁左右摇头则是低姿态。站直并露出手是高姿态,懒散地站着且手插口袋是低姿态。诸如此类。如果你不懂这些,在客户环境中就很难成功。这意味着你不太可能整合客户数据或让人们使用你的软件。也就意味着失败。
这也是为什么前FDE们往往能成为优秀创始人的原因之一。(在每期YC(Y Combinator)孵化团队中,通常前Palantir员工创始人比前谷歌员工还多,尽管谷歌员工数量是Palantir的约50倍。)优秀的创始人天生擅长解读场合氛围、群体动态和权力关系。这点通常不被谈及,但它至关重要:创立一家成功的公司,就是要参与一场又一场的谈判,并(总体上)获胜。招聘、销售、融资在本质上都是谈判。若没有对人类行为的这种直觉,就很难在谈判中游刃有余。这是Palantir教会FDE的,也是在其他硅谷公司难以学到的。
另一点是,FDE必须擅长理解事物。你的效能直接取决于你学习客户语言、真正深入理解其业务运作方式的速度。如果你与医院合作,你很快就能谈论容量管理和患者吞吐量,而不是简单地说“帮助您改善医疗服务”。药物研发、健康保险、信息学、癌症免疫疗法等等亦是如此;所有这些都有专业词汇,做得好的人往往非常擅长快速掌握它们。
Tyler Cowen在其著作《人才》(Talent)中,我最喜欢的洞见之一是:最具才华的人往往会发展出自己独特的词汇和迷因(meme),这些词汇和迷因成为了通往由这个人构建的整个知识世界的入口。Tyler本人当然是一个绝佳的例子。任何MR(Marginal Revolution)读者都能立刻说出10多个Tyler式表达(Tylerisms)——例如“模型化这个”(model this)、“情境是稀缺之物”(context is that which is scarce)、“求解均衡”(solve for the equilibrium)、“大停滞”(the great stagnation)。你还能找到其他擅长此道的人。Thiel是一个。Elon Musk是另一个(“多行星物种”(multiplanetary species)、“保存意识之光”(preserving the light of consciousness)等都是迷因)。特朗普、尤德科夫斯基(Yudkowsky)、gwern、SSC(Slate Star Codex)、保罗·格雷厄姆(Paul Graham),他们都会定期创造迷因。事实证明,这是衡量影响力的一个良好指标。
这一洞见也适用于公司。Palantir拥有自己庞大的一套术语,其中一些相当晦涩,以至于“Palantir到底做什么?”成了网上的一个迷因。“本体论”(Ontology)是一个老词,此外还有“impl”、“艺术家聚居地”(artist’s colony)、“复利”(compounding)、“三十六房”(the 36 chambers)、“点”(dots)、“代谢痛苦”(metabolizing pain)、“伽马辐射”(gamma radiation)等等。重点不在于解释所有这些术语,每个术语都压缩了一整套丰富的见解;而在于,当你寻找加入的公司时,与其找一个没有特色语言的,不如找一个拥有丰富内部语言或词汇的,它能帮助你以更有趣的方式思考问题。
当提到Palantir的名字时,大多数人会想到Peter Thiel。但许多这些术语来自早期员工,尤其是现任公司总裁的Shyam Sankar。尽管如此,Peter对公司文化的影响仍然极其深远,尽管在我任职期间他完全未参与公司的运营。这份由Joe Lonsdale撰写的文件,曾是内部文件,后公开,它体现了这类文化原则的风格。
我认为,其中一个理念(可能)源于Peter,那就是不给人头衔。我在公司时,每个人或多或少都顶着“前线部署工程师”的头衔,除此之外只有五、六位总监(Director)和CEO。偶尔有人会自创一个不同的头衔(我认识一个人自称“特别情况主管”(Head of Special Situations),我觉得很搞笑),但这些从未真正流行起来。这可以直接追溯到Peter的吉拉尔式(Girardian)信念:如果你设置头衔,人们就会开始觊觎它们,最终导致公司内部产生竞争政治,破坏内部团结。不如干脆给所有人相同的头衔,让他们专注于目标。
当然,对于“扁平化层级”立场有许多很好的批评——《无结构的暴政》(The Tyranny of Structurelessness)就是一篇杰作——而且这种模式在现代初创公司中似乎也已基本过时,那里很快就会出现CEO、COO、VP、创始工程师(Founding Engineer)等等。但我的经验是,这在Palantir运作得很好。有些人比其他人更有影响力,但这种影响力通常基于某些令人印象深刻的成就,最重要的是,没有人可以命令其他人做什么。因此,即使某人很有影响力或者认为你的想法很蠢,如果你认为该做的事是对的,你都可以忽略他们,自己去构建。除此之外,这种文化还推崇这样的人:流传着这样的故事,某位工程师无视了一位总监,构建出了最终成为关键基础设施的东西,这被奉为效仿的榜样。
这种模式的代价是,公司常常让人觉得缺乏清晰的战略或方向,更像是一个聪明人构建小封地、各自随意发展的培养皿(Petri dish)。但它极具创造力。人们低估了有多少新颖的UI概念和想法是从这家公司涌现出来的。其中只有一部分现在有了非Palantir的对应物,例如Hex、Retool、Airflow都包含一些最初在Palantir开发的组件。公司现在在AI领域也在做同样的事——为大型企业部署大语言模型(LLM)的工具非常强大。
“无头衔”也意味着人们在公司内部的声望起落非常快。因为大家头衔相同,你必须通过其他方式判断影响力,比如“谁现在看起来和这位总监关系很铁”,或者“谁在领导这个似乎很重要的产品计划”,而不是“这个人是某某副总裁”。结果就是大规模的“英雄-混蛋”过山车——某人会风光一时,然后神秘消失几个月,不再参与任何可见的项目,而你永远无法完全确定发生了什么。
5. 蝙蝠信号 (Bat-signals)
另一个可以追溯到Peter的理念是人才蝙蝠信号(talent bat-signals)。现在自己创业了(目前处于保密阶段),我对此体会更深:招募优秀人才很难,你需要一个差异化的人才来源。如果你每年只是和Facebook/Google争夺同一批斯坦福CS毕业生,你必输无疑。这意味着你需要:(a) 一群特别想加入你(而非其他公司)的人才;(b) 一种大规模触达他们的方式。Palantir有几个差异化的招聘优势来源。
首先,是那些在国防/情报工作还不时髦时就支持它的人,这筛选出了例如比平常更多的来自中西部或红州的聪明工程师,以及许多聪明的退伍军人、前CIA/NSA人员,他们希望为美国效力,但也看到了为硅谷公司工作的吸引力。我入职第一天,在团队内部入职培训时和另一个人一起,他看起来比我年长一些。我问他之前在Palantir之前做什么。他面无表情地看着我的眼睛说:“我在‘局里’(the agency)工作了15年。”然后我被介绍给我的第一位负责人(lead),他以前是俄亥俄州的SWAT特警(!)和陆军老兵。
这样的人很多,许多都才华横溢,而且他们大多不会加入谷歌。Palantir是这类人唯一真正的“灯塔”,而且当爱国和支持军队还非常不时髦时,公司就高调宣扬这些。这建立了一个非常有效、独特的蝙蝠信号。(现在有了Anduril,以及众多的国防和制造业初创公司)。[6]
其次,至少在最初的炒作浪潮退去后(尤其是在特朗普执政时期,公司被视为异类时),想加入公司的人必须有点古怪。部分原因是在当时还不常见的那种激进的“聚焦使命”式品牌宣传,但公司也高调宣传员工工作时间长、薪酬低于市场水平、需要大量出差。同时,我们因与政府合作而被赶出硅谷招聘会。所有这些都筛选出了特定类型的人:能够独立思考,且不会因为一则负面新闻就过度反应的人。
6. 道德问题 (Morality)
道德问题引人入胜。公司毫不掩饰地亲西方,这一立场我基本认同——一个更倾向中共或俄罗斯的世界在我看来很糟糕,而这是摆在桌面上的选择。[7] 生活在自由国家的人很容易批评自由国家,但若你体验过另一种制度(我有过——童年在一个压制性国家生活过几年),批评就难多了。因此,即使我有时不同意军方的某些做法,我也不反对公司帮助军方。
但军方有时不做坏事吗?当然——我就反对伊拉克战争。这触及了问题的核心:在公司工作既非100%道德高尚——因为我们有时会帮助那些目标我并不同意的机构——也非100%邪恶:政府做很多好事,通过提供不那么糟糕的软件来帮助他们更高效地做事,是高尚之举。澄清这一点的一种方式是将公司的工作分为三类——这些分类并非完美,但请听我说:
- 道德中立。 正常的公司业务,例如联邦快递(FedEx)、CVS药店、金融公司、科技公司等等。有些人可能对此有意见,但总体上人们觉得没问题。
- 明确有益。 例如,与CDC(疾控中心)合作抗击疫情;与NCMEC(国家失踪与受虐儿童中心)合作打击儿童色情;等等。大多数人会同意这些都是值得去做的好事。
- 灰色地带。 我指的是“涉及道德上棘手、艰难决策”的工作:例子包括健康保险、移民执法、石油公司、军队、间谍机构、警察/犯罪等等。
每位工程师都面临选择:你可以去做像谷歌搜索或Facebook信息流这类基本属于第1类、看起来多少有些益处的事情。你也可以去做第2类的事情,比如GiveDirectly或OpenPhilanthropy之类的组织。
对Palantir的关键指控似乎是:“你不应该做第3类的事情,因为这有时涉及做出道德上错误的决定”。一个例子是2016-2020年间的移民执法,其中的某些方面让许多人感到不适。
但在我看来,完全忽视第3类,选择置身事外,也是一种责任的推卸。第3类中的机构必须存在。美国是由持枪者保卫的。警察必须执法——根据我的经验,即使是那些对警务某些方面感到道德不适的人,如果自己家被抢劫了,也会立刻报警。石油公司必须提供能源。健康保险公司必须不断做出艰难的决定。是的,所有这些事情都有令人不快的方面。但我们是否就该完全脱离所有这些机构,任其自行发展?
我不认为对于是否应该与第3类客户合作有一个明确的答案;这需要具体情况具体分析。Palantir对此的回应大致是:“我们会与大多数第3类组织合作,除非它们明显是坏的,并且我们相信民主进程会推动它们逐渐向好的方向发展。”因此:
- 在ICE(移民和海关执法局)问题上,他们在特朗普时期退出了与ERO(执法与递解行动办公室)的合作,但继续与HSI(国土安全调查处)合作。
- 他们确实与大多数其他第3类组织合作,理由是它们总体上在世界上行善,尽管人们也很容易指出它们做过的坏事。
- 我无法透露具体细节,但Palantir软件在阻止多起恐怖袭击中发挥了作用。我认为仅凭这一事实就证明了这一立场的正确性。
对许多人来说,这是一个令人不安的立场,正是因为你无法保证自己时时刻刻都在做100%的好事。在某种程度上,你受制于历史,并且你赌的是:(a) 所做的好事多于坏事;(b) 置身其中总比置身事外好。
这对我来说已经足够。其他人则选择去别的地方。
当然,这种立场的危险在于,它可能成为一个普遍适用的理由,为权力机构所欲的任何行为辩护。你只是在放大现有的流程。这就是“具体情况具体分析”的意义所在:没有普遍适用的答案,你必须具体问题具体分析。就我个人而言,我在那里的大部分时间都在做医疗健康和生物科技相关的事情,我对自己的贡献感到欣慰。我敢打赌,那些阻止了恐怖袭击的人,以及那些在大流行期间分发药品的人,也会为自己的贡献感到欣慰。
尽管潮流已经转变,如今投身于这些“棘手”领域已成时尚,但对技术从业者来说,这些问题依然切题。人工智能就是一个很好的例子——许多人对部署AI的某些后果感到不安。也许AI会被用于黑客攻击;也许深度伪造(deepfakes)会以各种方式让世界变得更糟;也许它会导致失业。但AI也有重大益处(Dario Amodei在最近的一篇文章中很好地阐述了其中一些)。
与Palantir类似,从事AI工作可能既非100%道德高尚,也非100%邪恶。不参与其中——或者呼吁暂停/停止,那只是幻想——不太可能是最佳立场。即使你不在OpenAI或Anthropic工作,如果你有能力从事AI相关的工作,你很可能也想以某种方式参与其中。有些容易的选择:构建评估(evals)、研究对齐(alignment)、研究社会韧性(societal resilience)。但我在此主张,灰色地带也值得投入:参与政府的AI政策制定。将AI部署到医疗健康等领域。当然,这很难。投身其中吧。[8]
当我思考当今AI领域最有影响力的人物时,他们几乎都是“在场者”——无论是在AI实验室、政府,还是在有影响力的智库。我宁愿成为其中之一,也不愿做一个空谈者。当然,这涉及艰难的决策。但最好在事情发生时身在其中,即使你之后不得不离开并敲响警钟。
7. 未来展望 (What next?)
我是否仍然看好这家公司?本轮AI周期的巨大生产力提升,将在AI开始为当今时代的大型公司和业务(在制造业、国防、物流、医疗健康等行业)提供杠杆作用时到来。Palantir已经与这些公司合作了十年。AI智能体(agent)最终将驱动许多核心业务流程,这些智能体依赖于对关键业务数据的读写访问权。花费十年整合企业数据,正是为企业部署AI的关键基础。机遇巨大。
所以,是的,我仍然看好。
至于我自己,我正在执行期待已久的宏伟计划,下一步是创办一家公司。是的,它会涉及政府业务。团队很棒,我们也在招聘。我们甚至有时也会谈论维特根斯坦。
感谢Rohit Krishnan、Tyler Cowen、Samir Unni、Sebastian Caliri、Mark Bissell和Vipul Shekhawat对本文提出的反馈意见。