原生于 Claude 的律师事务所

Article

原生于 Claude 的律师事务所

2026 年我如何真正在法律实践中使用 AI

几个月前,就在客户的收购案即将完成的前一天晚上,买方的法律顾问发来一封信,要求重组几个关键的交易条款。新的托管条件。扩大的赔偿例外条款。修改后的交割交付物清单。隐含的威胁是:接受这些改变,否则我们就退出。当时是晚上 7 点。

我将购买协议、披露附表和要求信上传给了 Claude。几分钟内,Claude 将每一个提议的变更与现有的交易条款进行了比对,并发现了买方律师显然没有注意到的问题:他们提议的两个例外条款与他们已经在披露附表中确认的陈述直接矛盾,第三个会与基本陈述部分产生内部冲突,这实际上会削弱买方自己的交割后保护。他们咄咄逼人的最后一刻的手段漏洞百出。

随着谈判在整个晚上通过来回的电子邮件继续进行,我将每一条新的沟通信息都喂给 Claude。它追踪了每一个提议的让步如何与整个协议中的条款相互作用,标记了接受一个变更会在另一部分产生风险的地方,并帮助我构建了一个回应:在值得让步的地方让步,在关键问题上坚持立场。到晚上 11 点,我们已经有了一套清晰的反驳立场,每一个都基于对买方自己语言的具体交叉引用。第二天早上,交易以我客户满意的条款完成了。

一家中型律师事务所的三名初级律师组成的团队需要到第二天早上才能得出这样的分析。而我在不到两个小时内就掌握了核心内容。

我经营着一家只有两人的精品律师事务所。我们处理初创企业组建、风险投资交易和监管合规工作。我们的竞争对手是拥有数百甚至数千名律师的律师事务所。按理说,我们是不可能做到这一点的。但过去一年发生的事情已经很清楚了:一家围绕 AI 建立的小型律师事务所不仅能跟上大型竞争对手的步伐。它的行动速度更快,能产出更彻底的工作成果,并且以一种在 18 个月前根本不可能的成本结构运营。

我围绕着建立执业实践的工具是 Anthropic 开发的 Claude。这篇文章解释了我如何每天在真正的法律工作中实际使用它。不是理论。而是工作流程。

为什么是 Claude,而不是“法律 AI”

市场上到处都是专门的法律 AI 产品。Harvey、Spellbook、CoCounsel、Luminance。它们都有一个共同的论点:律师需要专门为法律工作构建的 AI。我已经评估了其中的大部分。对于一家小型律师事务所的从业者来说,一个配置良好的通用 AI 会更好。而且优势非常明显。

这些专门的产品只是建立在驱动通用工具的相同基础模型之上的套壳产品。他们的营销说辞听起来很有说服力:我们会根据你们律所的策略来定制 AI,用你们的模板来训练它,围绕你们的简报库或条款库构建工作流。其中有些确实做得还算不错。但这种说辞包含了一个根本性的误解,即价值究竟存在于何处。

模板库并不是竞争优势。在你执业领域的每一家有能力的律所都有大致相同的模板。保密协议(NDA)、股票购买协议、录用通知书。这些都是商品化的投入。区分一位优秀律师和一位平庸律师的从来不是模板。而是律师用模板了什么:他们如何发现对方埋藏在第 14(c) 节中的问题,他们如何知道哪种赔偿争议值得争取,哪种应该让步,他们如何组织建议电子邮件以便客户真正了解风险。这就是判断力。而判断力并不存在于律所层面。它存在于个体专业人士的层面。

当法律 AI 公司谈论为律所的策略定制 AI 时,他们正在解决一个几乎无关紧要的问题,而忽略了真正重要的问题。真正的杠杆作用并不来自于 AI 从哪个模板开始,而是来自于告诉它如何思考工作的指令:寻找什么,标记什么,如何权衡相互冲突的考虑因素,以什么格式交付输出,使用什么语气与客户沟通。这些指令编码的是个别律师的判断力,而不是律所的模板库。而这正是 Claude 的技能(skill)系统所要实现的功能。

我已经创建了自定义的指令文件,称为“技能(skills)”,它们编码了我的分析框架、我偏好的格式、我的语气以及我对应当如何完成特定类型法律工作的判断。当我上传一份合同进行审查时,Claude 并未应用通用的框架。它甚至没有应用我律所的框架。它会自动应用我的框架,这是我经过十多年的执业实践发展出来的。律所策略与个别律师编码的判断力之间的区别,就像是给某人一张食谱和教他们如何做饭之间的区别。

还有一个更根本的问题,这个问题对于任何在 Microsoft Word 中度过职业生涯的人来说都是最重要的。Claude 是一个前沿的 AI 模型,它已经针对编写代码进行了大量的优化。这听起来可能与法律实践无关,直到你意识到这意味着什么:Claude 可以即时编写代码,直接操作律师已经使用的应用程序。

具体想想这意味着什么。每一位阅读本文的律师都曾在 Word 格式排版上浪费过数小时。从另一个文档粘贴时损坏的段落编号。拒绝配合的样式。跨版本损坏的修订跟踪。失效的交叉引用。需要手动注意每一个句号和逗号的蓝皮书引用格式。这些不是法律问题。这些是软件问题。而 Claude 通过编写软件来解决软件问题。当我告诉 Claude 对合同应用跟踪更改时,它不使用插件或宏。它在 XML 级别打开 .docx 文件,并写入 Microsoft Word 预期的精确标记,将其归功于我的名下,保留每一个格式细节。当我告诉它将简报中的引用格式标准化时,它会在几秒钟内编写代码来解析和重新格式化每一个引用。结果与专家手工操作无法区分,但交付所需的时间却只是很小的一部分。

这是任何专业法律 AI 产品都无法匹敌的能力差距。它们为你提供了一个谈论文档的聊天机器人。Claude 是一个能够深入这些文档并修改它们的系统。这就像是一位能够告诉你合同中有什么问题的初级律师,与一位能够修复它、格式化它、生成红线版本并起草求职信的初级律师之间的区别,而所有这些都不需要你打开任何一个应用程序。通用 AI 的进步速度快于任何垂直产品所能跟上的速度。当你在使用前沿模型时,每一项新功能都会在第一天就发送给你。当你在使用一个套壳产品时,你就在等待别人的工程团队决定接下来要构建什么。

我在这里描述的是我自己的业务,即交易业务。但架构本身并没有特定于任何业务。诉讼律师可以构建用于证言准备、动议起草、判例法综合和证据开示审查的技能。税务律师可以构建用于实体构建、意见书框架和监管监控的技能。家庭律师可以构建用于资产追踪和监护权分析的技能。方法是相同的:采用一个强大的通用模型,教它你的业务,并让它复合你的判断。内容是你的。

三种模式

Claude 的桌面应用程序有三种模式。学习何时使用每一种模式是使其发挥作用的最重要的一步。

聊天(Chat) 是对话界面。我像和坐在桌子对面快速、知识渊博的初级律师交谈一样与 Claude 交谈。这就是我去分析法律问题、集思广益谈判策略、初步了解合同条款或从头开始起草的地方。我保持对每一步的控制。大多数使用过 ChatGPT 或类似工具的律师只体验过这种模式。

协同(Cowork) 是自主模式,它是改变一切的模式。我将 Claude 指向我电脑上的一个文件夹,给它一个任务,它就会去执行。它读取文件,创建新文件,编辑现有文档,并自行决定如何从 A 点到达 B 点。当我有需要进行完整红线修改的 40 页协议,或者需要从条款清单生成的成叠的交割文件时,我把它交给 Cowork 并让它工作。这是大多数律师还没有尝试过的模式。它也是将最大程度地改变他们执业方式的模式。

代码(Code) 是开发模式。完全访问终端。大多数律师并不需要每天使用它。但我有一种情况使得阅读长文档很困难,所以我使用 Code 构建了一个命令行工具,将法律文档转换为语音音频。它处理整个管道:解析 Word 文档和 PDF,将诸如“第 4.2(b)(iii) 节”等法律格式转换为自然语音,扩展缩写,对文本进行分块,将其发送给 AI 语音 API,并组装成最终的音频文件。现在我在通勤途中听合同。Claude 构建了整个系统。

教 Claude 你的执业方式

这就是杠杆作用变成两年前我不敢相信的东西的地方。

Anthropic 发布了一份关于为 Claude 构建自定义“技能”的指南:这是一种结构化的指令文件,教它在特定上下文中如何表现。这不是你每次都要输入的提示词。而是一组持久的指令,当情况需要时就会自动触发。我没有从头到尾阅读指南,而是将其上传给了 Claude,并提出了一个更好的问题:根据我们之间进行过的数百次对话,涵盖合同起草、客户电子邮件、文档编辑、法律研究和政策编写,哪些技能会对我的执业产生最大的影响?

Claude 分析了我们几个月的工作并找出了规律:哪些任务我重复得最多,哪里摩擦最大,哪里结构化的自动化能节省最多时间。它推荐的技能并不是通用的。它们专门针对我的实际工作方式。不是“更快地起草合同”,而是“一种合同审查技能,具有四种不同的模式(取决于上下文)、严重性评级、缺失条款清单、市场术语基准测试,并在你准备好标记文档时无缝过渡到跟踪更改的编辑技能。”

我们花了几个小时完善了细节。在默认设置不符合我偏好的地方,我提出了反对意见。最后,我有六个生产就绪的技能被捆绑成 Cowork 桌面应用程序的单个插件中:合同审查、修订跟踪编辑、合同起草、客户沟通、法律研究和政策撰写。每一个都编码了多年积累的关于我如何处理该类型工作的专业判断。

这对律所管理的意义在于:这个插件是可移植的。如果我有 50 名初级律师,我可以把它安装在每台机器上。每一位初级律师都会立即使用我的分析框架生成合同审查,用我的语气起草通信,并以我偏好的格式应用修订跟踪。过去需要多年指导才能传承的知识,现在变成了一个从初稿就开始起作用的指令文件。输出仍需要律师审查,但审查的基线要高得多。

这在实践中看起来像什么

来自实际工作的三个例子,因为我希望这更加具体。

不打开 Word 的修订跟踪。 交易对手发回了一份红线协议。关于陈述、赔偿、知识产权和交割条件的修改长达 40 页。我将文档上传给 Claude 并说:“帮我从客户的角度评估交易对手的更改。”我的合同审查技能就会触发。Claude 按严重程度组织每一项更改,标记出交易对手转移风险的地方,识别修改条款之间的冲突,检查应该存在但缺失的标准条款,并为每个问题提供带有具体反驳语言的摘要。

然后我运用我的判断。Claude 在标记中发现了一个模式。凭经验我知道那种模式通常意味着什么。Claude 为一个有争议的条款生成了三种替代方案。我选择了考虑了没有任何 AI 能够获取的关系动态和交易背景的那一个。一旦我做出了决定,我就会告诉 Claude 应用这些编辑。这是你第一次看到时会惊掉下巴的部分。Claude 在 XML 级别打开 Word 文档,应用归属于我的名字的修订跟踪,保留每一个格式细节,并生成一个干净的 .docx,其中包含真实的修订跟踪,对方律师可以在 Microsoft Word 中打开并正常审阅。我不用打开 Word。我也不打开 Litera。Claude 生成了红线版本。我审查每一处更改,然后发送出去。随后,客户沟通技能会以正确的语气起草这封求职信。从收到标记到准备好发送响应包的总时间:不到一个小时,其中大约 30 分钟是我自己的思考时间。

没有幻觉的研究。 客户需要了解新产品的监管环境。这个问题涉及多个机构和重叠的法定框架。我的研究技能指示 Claude 同时从每个相关角度发起并行研究,而不是依次进行:证券分析、州许可要求、银行法规、消费者保护的影响。它在每个子主题下运行多次搜索,交叉引用来源,并优先考虑主要权威(法规、规章、机构指南、判例法),而不是次要评论。

在向我交付任何内容之前,这项技能要求 Claude 运行自我审查。这是至关重要的,也是大多数人跳过的部分。Claude 必须验证引用的每一个权威来源实际上是否如备忘录所说。它必须标记出其信心低于高水平的任何内容。它必须检查各节之间是否存在内部矛盾。而且,它必须特别防范产生幻觉的引用,正是这个问题导致几名律师受到制裁并上了全国新闻。提交人工智能生成的虚假引用的律师使用的是没有这种验证层的工具。问题从来不是人工智能本身。而是没有质量控制的人工智能。

输出的是一份结构化的研究备忘录,带有先讲结论的执行摘要、具体的法规引用和实用的建议,如果让一位初级律师来制作,需要几天时间。Claude 在不到一个小时内提交了初稿。然后我审查每一个引用,对分析进行压力测试,并在我的判断与输出有分歧的地方进行修改。总时间仍然是从头开始所需时间的一小部分。并且由于该技能是根据我的标准进行校准的(带有明确不确定性标志的自信结论、比较监管框架的表格、而不是学术上的含糊其辞的实用建议),该备忘录立即可用。

实时合同解释。 一位客户在上午中旬打电话来说,他们刚刚收到交易对手的催告函,声称违反了商业服务协议并威胁要终止合同。客户有 48 小时的时间做出回应。我上传了协议、催告函以及客户过去三个月与交易对手的通信记录。Claude 将催告函中的每一项事实指控与所引用的具体合同条款进行了比对,发现这四项声称的违约中有两项所涉及的义务,已经被交易对手自己的法律顾问起草的补充协议明确修改过了。这封催告函似乎是在没有检查他们自己修正案的情况下写成的。在我准备回复时,我让 Claude 对起草的每一段文字进行压力测试,看看我的任何论点是否对协议中的其他条款产生了意外的影响。它发现了一个问题:我计划在服务水平指标上提出的一项辩护,可能会被解读为在第 7 节的付款争议上做出了让步。我重写了回复。那种在积极起草时进行实时、逐条压力测试的工作,过去通常需要第二位律师审查你的工作。现在,它发生完成工作的同一次对话中。

特权(保密特权)问题

每位律师都会问。简短的回答是:允许你使用云存储、电子取证平台和在线法律研究数据库的相同框架也适用于此。美国律师协会(ABA)指南和州律师协会道德意见将 AI 工具视为受代理/工具异常条款涵盖的第三方技术提供商。你的义务是尽合理努力保护客户数据,在实践中,这意味着关闭使用你的输入进行的模型训练,了解提供商的数据处理做法,并记录你的推理过程。Anthropic 提供了一个零数据保留的 API 选项和业务数据处理协议,因此您的任何客户数据都不会用于训练模型,输入也不会在会话之外存储。这与你在将客户文件放入 Dropbox、Google Drive 或 Clio 之前所做的尽职调查相同。

我更进了一步。我让 Claude 帮我在聘用信中起草了一份关于 AI 使用的条款。该条款将 AI 定义为效率和质量的提升工具,强调律师监督,将数据处理与现有的保密义务联系起来,并获得客户同意。客户在签署时连眼睛都不眨一下。他们大多数都以为我已经在使用 AI 了。他们是对的。

大多数司法管辖区的道德准则现在都要求具备技术能力。我们正接近这样一个时刻:使用这些工具反而成为了更难辩护的职业责任立场。

提示词就是技能

大多数尝试 AI 的律师会写一些诸如“审查这份合同”之类的内容,然后得到平庸的回复。接着他们就会认定 AI 对法律工作没有用。

问题不在于 AI。问题在于输入。

对比一下“审查这份合同”与“从供应商的角度审查这份服务协议。标记出客户转移的风险超出了此类交易市场规范的条款。检查应该存在但缺失的条款,包括责任限制、知识产权所有权、数据处理以及为便利而终止的条款。对每一个高严重性问题,生成一份包含严重性评级以及具体反驳语言的摘要。请注意,供应商的谈判筹码有限,希望达成交易,因此建议应侧重于值得争取的条款,而不是为了优雅地让步而放弃的条款。”

第二个版本在第一遍生成的输出就能用。而第一个版本产生的工作成果,即使有用,也需要大量修改。“AI 是个玩具”和“AI 改变了我的执业”之间的全部差距,就在于你的指令质量。这就是为什么技能(skills)很重要的原因:它们对细节进行了编码,所以你只需编写一次,每次就能自动触发。

这改变了什么

由这一切产生了一些值得一提的事情。

人员配备。 我经营一家两人律所,却处理着规模大得多的业务的工作量。这是人工智能的直接功能。传统上成为招聘初级律师的理由的工作——初审文件审查、研究备忘录、初稿、红线摘要、日常通信——现在都在我的监督下由 Claude 处理。要明确的是:离开我们律所的每一份文件都经过了执业律师的审查、修改和批准。AI 完成初步筛选。我负责生成最终工作成果。初级律师并没有过时。但是,何时雇用一名律师才具有经济意义的门槛已经改变了。你需要他们做的事情也发生了改变:判断力、客户关系和 AI 输出的监督,而不是 2,000 个小时的文档制作。

计费。 AI 改变了价值等式。对于某些任务,节省的时间是显而易见的,我会将其传递给客户。对于其他任务,同样的时间能产生比以前更加深入的分析、更全面的问题发现和更高质量的起草。关键不在于每项任务花费的时间更少。而是在于律师的每一小时工作都能产生更大的价值。我的律所在传统的按小时计费之外,还提供订阅定价,具体取决于业务约定。订阅客户只需支付固定的月费,即可获得持续的咨询、合同审查、合规监控和日常管理。没有计费器。AI 使这种模式行之有效,因为我能够在可预测的费用结构内提供更全面的服务。客户喜欢这种模式:他们不再害怕拿起电话或发送电子邮件。而且收入也是可预测的,而不是起伏不定的。

判断力。 我所描述的一切都产生了一种诱惑,即让 AI 做太多事情。停止检查。关于这方面的研究是一致的:那些在使用 AI 时超出其能力范围,或者在不质询输出结果的情况下信任它的人,其表现甚至不如那些根本不使用 AI 的人。借助这项技术取得成功的律师从根本上理解,AI 不是在从事法律实务。你才是从事法律实务的人。AI 让你更快、更透彻、更一致。但是判断力,那个你决定为什么而战和让步什么、字里行间领会言外之意、做出可能产生任何一种结果的决定并押上你声誉的部分,是属于你的。经验丰富的律师在这个新世界拥有巨大的优势,而大多数人还没有意识到这一点。如果你已经花了 10 年或 20 年在你的业务领域培养判断力,那么你恰好掌握了 AI 使其变得更有价值(而不是更少)的资产。

去构建吧

我不在 Anthropic 工作。我是一名执业律师,我尝试了所有可用的 AI 工具,并围绕最适合我实际工作方式的工具建立了我的执业实践。

大多数律师使用 AI 的方式(在聊天机器人中输入问题并期待最好的结果)与我在这里描述的之间的差距是巨大的。缩小这种差距不需要技术技能。它需要投入几个小时来学习该工具的实际运作方式:聊天(Chat)和协作(Cowork)之间的区别,为什么长而详细的提示比简短的提示产生显著更好的结果,如何构建一种编码你判断力的技能,如何将技能捆绑成任何同事都可以使用的插件。

下载桌面应用程序。选择你最常做的任务。写一个提示词,详细地描述你到底希望如何完成它。看看会返回什么。然后构建你的第一个技能(skill)。回报会复合得很快。

原文链接