|
【专题】法律人如何使用AI |
副總編 二十三級 |
这里收录一些我在法律专业使用AI方面阅读文章的笔记
|
副總編 二十三級 |
1.《我用 AI Agent 翻译了一本德文法学教科书》 作者:马强伟
在对话窗口时代,用AI翻译文献必须借助OCR,此时AI只是辅助,而且需要打磨prompt,核心在于:要求 AI 扮演德汉法律翻译专家,重点破除翻译腔、拆解德语长难句、统一专业术语,并设定了“初稿→自我诊断→定稿”的三步工作流。
AI Agent的特点是:可以安装在电脑上,直接读取、控制和编辑本地文件。你可以用自然语言指挥它干活。
Claude 现在还推出了桌面版的 Claude Coworker,有传统的软件交互界面,OpenAI 推出了 Codex 应用版、谷歌的 Antigravity 也很不错。MiniMax也有本地 AI Agent 工具。 (等DeepSeek有了专门的工具我也会试试,目前我用的是Claude Code)
|
|
副總編 二十三級 |
利用Claude Code进行翻译的流程:把人工翻译的流程还原出来,让 AI 照着做。 具体包括 ①把书末的关键词索引翻译出来,统一全书重要术语,再逐章翻译正文 ②把传统的 PDF 文献转换成 Markdown 格式
第一步 PDF 转 Markdown 传统 PDF 文献是为印刷设计的,页眉页脚、分栏排版、脚注尾注,人读着方便,但 AI 读起来很容易上下文断裂、结构错乱。Markdown 是纯文本格式,没有复杂排版,是最方便 AI 阅读和处理的格式。 该项工作可以让Claude Code代劳
如果是需要 OCR 的扫描版文献,难度要更大一点,因为目前的 OCR 工具准确度还不能满足翻译的精准要求。最经济的方式还是让 Claude Code 直接调用国内比较便宜的支持 OCR 的大模型 API,例如千问 OCR 模型,把模型的说明文档发给 Claude Code,它可以自己写脚本完成 OCR 任务。
对于特殊格式(如德文著作)还需要具体说明,例如:在原文段落的首行的左边或右边有一个数字,是德文著作中的边码,需要保留,用【1】这样的格式统一放在段落首行;原文中有脚注,要准确提取为 Markdown 格式的脚注,统一放在文档末尾。
按照同样的流程把全部章节导出为 Markdown 文件后,开始关键词的翻译工作。
|
|
副總編 二十三級 |
第二步 术语统一 此时需要借助词典,常用方法是:把一本常用的德汉法律词典转成了词条格式,也用 Markdown 文件保存,方便 AI 工具检索。
例如: 文件中词条的格式如下(每一行也一个单词,方便AI检索): **Zivilgericht** (Neutrum, 中性名词):民事法院 **zivilgerichtlich** (Adjektiv, 形容词):民事法院的,民事诉讼的 **Zivilgerichtsbarkeit** (Femininum, 阴性名词):民事审判权, 民事诉讼管辖权
之后让 Claude Code 参照词条中的译法,把关键词索引翻译成中文。完成后换 Codex 去审核和标注。
|
|
副總編 二十三級 |
第三步 逐章翻译与交叉审核
Skill 也是一个 Markdown 文件,里面写好了你要 AI 执行的全部指令——角色设定、工作步骤、注意事项等等。和直接把 prompt 一股脑丢给 AI 不同,Skill 可以分步骤、按条件地向 AI 披露指令:先做什么、再做什么、遇到什么情况怎么处理,像一份详细的操作手册。在skill的顶部是对这个技能的描述,除了用户指明调用某个skill外,在自然语言交流中如果触发关键词,AI Agent也会主动调用。所以,你还可以安装很多个 Skill,AI Agent 会根据每个 Skill 的描述,在需要的时候自动判断该调用哪一个。 AI Agent 相比对话式 AI 的一个优势:你可以把自己的经验沉淀为可复用的工具,越用越顺手。
术语统一完成后,我把翻译 prompt 发给 Claude Code,让它帮我生成了一个 Skill。 作者这里用的是Codex(因为Claude太贵),然后用Antigravity 以专业编辑的身份去审核
|
|
副總編 二十三級 |
三、启示 1.先用起来。 提早把 AI 融入自己的工作流,你才能发现哪些活 AI 能干、哪些干不了,然后你才会想怎么去解决这些痛点。更重要的是,只有开始用了,你才会发现自己现有的工作方式哪些地方是不兼容 AI 的。
2.不要创造伪需求。 一方面它还没有成熟到让我完全脱离电脑,另一方面我的大部分工作本来就是在电脑前完成的——“用手机指挥 AI 干活”在现阶段对我来说就是一个伪需求。
3.AI 放大的是你已有的经验,不是凭空给你经验。 AI 复现的是最后那个“建造”的动作,前面那些认知劳动全是人完成的。换一个不懂的人,给 AI 同样的篇幅,大概率出不来能用的东西。 AI 可以快速生成译文,但术语对不对、句意准不准、概念在中国法语境下能不能用——这些判断只有懂行的人才能做。越是功力深厚的译者,越能发现不容易察觉的翻译错误;功力不够的人来审校,错误照样会漏过去。
也就是说,尽早用起来就是在摸索怎么更好地把自己的专业经验传导给 AI。
|
|
副總編 二十三級 |
法律人的核心竞争力还是在对法律问题的理解和判断。AI 不会改变这一点,但它正在改变我们把理解和判断落地的方式。
重要的其实是主动接纳AI进入我们的工作流程中。我更建议的方式是:选一个工具装上,遇到不会的直接问 AI 本身。这恰恰就是使用 AI Agent 的第一课。
|
|
副總編 二十三級 |
附录:作者早期借助AI翻译法学文献的prompt

|
|
副總編 二十三級 |
2.《你可以把思考外包,但不能把理解外包》 作者:马强伟 地址:https://mp.weixin.qq.com/s/GXY4A--IducMdwKZclXqsQ
大模型的文本其实是可以加水印的——不是肉眼能看到的那种,而是藏在用词选择的统计规律里。 到现在,国内主流大模型厂商基本都是加一个可见的“AI 生成”标签和文件元数据。没有谁公开部署统计层面的文本水印。原因也好理解:水印可以被改写绕过。
在 AI 时代,大量脑力活动确实可以外包出去:检索、整理、翻译、起草,Agent 都能做。但你自己“懂不懂”,是没办法外包的,只能靠自己学出来。说到底,还是那句话,AI 放大的是已有的经验,不会凭空给你经验。
大胆用这些工具,甚至要主动去用。但你一定要能理解 AI 给你的东西。一个法律适用观点、一段论证摆在面前,你得知道它对不对,好在哪、差在哪。如果自己基本功不扎实,分不清对错,甚至根本读不懂它在说什么,那才是真正有问题的。
|
|
副總編 二十三級 |
3.《Agent 帮我出的民诉案例题》 作者:马强伟 地址:https://mp.weixin.qq.com/s/MIJGg9pbrDBzepZwnIkX2w
对于需要创新性的规范法学研究论文,目前Agent还做不好。规范背后的价值评判太难了。人类自己还没搞清楚、无法用语言精确描述的东西,指望语言大模型来解决,还很遥远。
但是,毕竟不是所有的研究内容都涉及这么复杂的价值评价问题,所以 Agent 在法学论文写作中还是大有可为。 比如:文献梳理(尤其是比较法文献);讨论思路(发送问题和材料后讨论);法律检索(准备法律法规、司法解释和案例集)
让人担心的可能是,Agent 的出现让论文变得更容易被制造出来。真正让人担忧的是,我们的学术界还有没有识别出优秀研究成果的能力。
|
|
副總編 二十三級 |
📝 让 Agent 出案例题
案例 1:建设工程质量保函纠纷中的共同诉讼、管辖与上诉效力 (重点:共同诉讼管辖竞合、主-保共同诉讼性质、证明责任分配与鉴定费承担、上诉审理范围与不利益变更禁止) 案情 甲建设投资有限公司(B 公司,住所地 A 市)于 2024 年 3 月与乙建筑工程有限公司(U 公司,住所地 B 市)签订《建设工程施工合同》一份,约定 U 公司承建 B 公司在 D 市开发的"星河商业广场"项目,合同价款人民币 8000 万元,工期 12 个月。合同第 37 条载明:「因本合同发生的争议,双方协商不成的,由发包人住所地人民法院管辖。」(即约定由 A 市法院管辖) 为保证工程质量,合同另约定 U 公司应在开工前提供「工程质量保函」一份。2024 年 4 月 5 日,C 银行 C 市分行(X 银行,住所地 C 市)应 U 公司申请向 B 公司开具《工程质量保函》,承诺:「在受益人(B 公司)出具书面索赔通知,证明承包人(U 公司)违反合同约定的工程质量标准时,本行作为连带责任保证人,在保函金额人民币 600 万元范围内向受益人承担赔偿责任。」保函未约定争议管辖条款。 2025 年 3 月 1 日,U 公司完工交付,B 公司组织五方验收,出具《竣工验收意见书》,意见为「基本合格,部分细部缺陷需整改」。U 公司完成整改后,B 公司分期支付了大部分工程款。 2025 年 8 月,星河商业广场地下室出现严重渗水。B 公司单方委托甲市某工程质量检测中心出具《工程质量鉴定意见书》,认定地下室防水工程因施工不规范存在重大质量缺陷,修复费用约 480 万元。 2025 年 10 月 8 日,B 公司依据主合同第 37 条协议管辖条款,向 A 市某区人民法院起诉,将 U 公司、X 银行列为共同被告,请求: 1.判令 U 公司向原告赔偿工程质量修复费用 480 万元; 2.判令 X 银行在 480 万元范围内(且不超过保函金额 600 万元)与 U 公司承担连带赔偿责任。
|
|
副總編 二十三級 |
问题 请结合中国《民事诉讼法》《民诉法解释》《民法典担保制度司法解释》等相关规定,回答以下问题: 1.A 市某区人民法院对本案是否具有管辖权?U 公司与 X 银行的管辖权异议是否成立? 2.B 公司将 U 公司、X 银行作为共同被告起诉,构成何种共同诉讼?U 公司对 480 万元的认诺,对 X 银行有何效力?法院应否依 U 公司的认诺直接判决 X 银行承担保证责任? 3.关于工程质量缺陷是否存在的鉴定,应由哪一方预付鉴定费?B 公司逾期未预付,承担举证不能后果的范围应当如何确定(仅对 X 银行部分?还是包括对 U 公司部分?)?这一处理是否符合证明责任分配的原理? 4.(1) B 公司仅就驳回对 X 银行诉讼请求的部分上诉,U 公司是否当然成为二审的当事人?U 公司在二审中的诉讼地位是什么? (2) 二审法院能否对一审"U 公司赔偿 480 万元"的部分进行审理? (3) 假设二审经鉴定查明工程质量缺陷修复费用实际为 300 万元(低于 U 公司认诺金额),二审能否主动将 U 公司的赔偿数额由 480 万元改为 300 万元?
|
|
副總編 二十三級 |
4.《装好了 Claude Code,下一步做什么——写给法律人的 Agent 入门指南》 作者:马强伟 地址:https://mp.weixin.qq.com/s/Srf8QgqBxjDVaiscY_11wg
很多人抱怨 Agent 不好用,其实模型没那么差,差的是你还没告诉它在哪儿干、用什么干、干什么。换个说法,Agent 不是装上就自动好用。它需要一个工作目录(在哪儿干),需要规则文件和几个常用 skill(用什么干),也需要知道这一次到底想让它做什么(干什么)。
遇到具体技术问题,有一个非常好的窍门是,直接问豆包、Kimi 或者其他网页 AI,把报错截图发过去,让它一步一步教你。现在学习工具,很多时候就是这样开始的。我最近越来越强烈地感觉到,AI 时代的学习范式已经变了。很多东西不再是等别人教会你,而是自己带着问题去试,试不通就问 AI。
|
|
副總編 二十三級 |
🧰 Agent 强在哪里
以前我们用 AI,大多是在聊天框里。复制一段材料进去,问它怎么看。它回答。再追问。再回答。它再聪明,也只能看见你喂进去的那一点东西。 Agent 可以进入你电脑的某个文件夹里,自己读文件、改文件,必要时调用工具,在你允许的范围内执行命令。可以说,Agent提高了模型的能力上限。
(所谓Harness工程,就是给大模型配一套干活的环境:它能看到哪些文件,能用哪些工具,遇到 PDF 怎么处理,检索先查哪里,写完以后怎么自检,哪些动作必须先问你)
|
|
副總編 二十三級 |
🧩 先让工具在电脑上跑起来
以 Claude Code 为例,官方文档给 macOS、Linux、WSL 的安装命令是:
curl -fsSL https://claude.ai/install.sh | bash
复制到终端里运行,就可以安装 Claude Code。具体步骤以 官方文档为准。Claude 账号不好处理的,也可以按 DeepSeek 的 接入说明,把 Claude Code 接到 DeepSeek 的 API 上。
Codex 可以在 OpenAI 的 官网下载。最近 Codex 更新很频繁,桌面应用也更像传统软件界面,对非程序员会友好一点。国内类似工具还有 Qwen Code、CodeBuddy等。我的感觉是,入门阶段先选一个能跑起来的,不要一开始就同时折腾好几个。 安装过程中遇到问题,就把报错发给 AI 问。大部分入门问题,都能这样解决。
|
|
副總編 二十三級 |
📁 给 Agent 一个工作现场
Claude Code 通常是在终端里打开的。终端里最常用的命令之一是 cd,意思是进入某个文件夹。比如你的论文材料放在桌面上的“论文”文件夹里,就可以在终端输入:
cd ~/Desktop/论文 claude
这样启动以后,这个“论文”文件夹就是它的工作目录。它能优先看到的,就是这个文件夹里的材料。
如果不知道文件夹路径怎么复制,macOS 可以在访达里右键文件夹,按住 Option 键,选择“拷贝……作为路径名称”;Windows 可以在资源管理器里右键文件夹,选择“复制为路径”。熟练以后,还可以探索更快捷的打开方式,这里先不展开。
不要在一个空地方打开 Claude,然后问它“帮我改论文”。写论文,就建一个论文文件夹;学习一门课程,就建一个课程文件夹;做案例研习,就建一个案例题文件夹。正文、文献、案例、笔记都放进去,文件名尽量让人能看懂。当然也可以和 Agent 讨论,文件夹内的文件该怎么管理。
|
|
副總編 二十三級 |
📝 工作手册比提示词更重要 文件夹准备好以后,还要告诉它这个项目大概怎么做。Claude Code 里常见的是CLAUDE.md,Codex 里对应的是 AGENTS.md。可以把它理解成一份写给 Agent 的工作手册。 比如 GitHub 上有人把 Karpathy 对 LLM 写代码的要求整理成了可直接用的 CLAUDE.md 规则。可以让 Claude 参考这类规则,再结合自己的工作习惯,生成一个初稿。 但这个文件最终还是要自己改。全局规则写长期习惯,比如用中文回答、不确定不要猜。
Claude Code 的全局文件通常放在 ~/.claude/CLAUDE.md,Codex 的全局文件通常放在 ~/.codex/AGENTS.md。这些都是隐藏文件夹,找不到就问 AI 怎么打开。项目规则写当前文件夹里的事,比如论文题目、核心判断、材料位置、哪些观点已经被否定过。项目规则就放在项目根目录下,比如 CLAUDE.md 或 AGENTS.md。
拿我自己的配置来说,全局 CLAUDE.md 里写了:我的研究方向是民商事争议解决;涉及学术或法律内容,不能编造文献标题、案号和页码;找不到支撑就写“待查证”;工作时尽量按最短路径解决问题等。在公众号这个项目的 CLAUDE.md,则会写得更具体:这是 Zivilist Newsletter 的写作区,文章要像跟同行聊天,先有素材和主线,再写正文,文中观点要具体到来源,正文风格要符合我的表达习惯。 这样的规则不复杂,但会让 Agent 少走很多弯路。
更玄一点说,这些规则文件会慢慢塑造你使用 Agent 的“手感”。同一个模型,全局规则和项目规则写得不一样,回答的气质、谨慎程度、做事顺序都会不一样。这类文件没有一个标准答案,我自己的感觉是,先写下最重要的几条,用着用着再改。Agent 哪些地方老出错,哪些地方总是不符合你的习惯,就把它写进去。时间久了,它会越来越像一个熟悉你工作方式的助理。 这也是 Agent 和以前的办公软件很不一样的地方。装好只是第一步,后面还要在使用中慢慢磨合,能交给它做的事也会越来越多。
|
|
副總編 二十三級 |
🛠️ 重复做的事,写成 skill CLAUDE.md 解决的是“你是谁、这个项目是什么”。skill 解决的是“这类事情平时怎么做”。 比如法律检索、PDF OCR、论文审改、公众号排版,这些事情会反复出现。每次都在对话框里重新解释流程很烦,就可以写成 skill。它通常是一个文件夹,里面有一个 SKILL.md,写清楚触发条件、操作步骤、输出格式和不能做的事。
skill 可以自己写,也可以先找现成的。我一般从下面这几个地方找:(1)腾讯的 Skillhub、Clawhub 中国站;(2)让 Claude 去 GitHub 搜有没有现成 skill;(3)或者先安装 find-skills 这类发现工具,再让它帮我找。找不到合适的,就用内置的 skill-creator,根据自己的流程写一个。(备注:还可以在Github上找)
这里不用一开始下载太多。最好的入门方式,是先找一两个真正用得上的 skill,调用它做几次事,再打开它的 SKILL.md 看看里面到底写了什么。 我自己常用的一个 skill 是 PaddleOCR。它把 OCR 流程封装起来,配置好以后,可以把扫描版 PDF 解析成 Markdown,并尽量保留页码、脚注和标题层级。PaddleOCR 的 API 目前是每天有 2 万页的免费额度。 另一个是我自己和 Claude 写的 legal-search,还在完善中。基本思路是把国家法律法规数据库的法条、公开可检索的指导性案例、最高法院公报案例、法答网精选问答等下载到本地,备课或写作时先做一轮基础检索。我还在尝试接入北大法宝 MCP,也在想办法处理人民法院案例库的检索。再往后,还可以根据个人需要增加地方高院网站、国家机关网站等公开信息源。
Skills 是我日常用得最多、也花时间调试最多的工具。有些 skill 很有意思,比如 Superpowers 插件里的 brainstorm,适合在复杂任务开始前和 Claude 讨论一轮。写代码的人常用的 Andrej Karpathy Skills,也可以下载来看看它的设计思路。
|
|
副總編 二十三級 |
🔌 MCP 不是越多越好 MCP 可以先理解成连接外部工具的转接头。比如让 Agent 控制浏览器,可以用 Playwright MCP;连接数据库、读取笔记系统,也可能要靠 MCP。 北大法宝提供了 MCP 服务,也提供了 CLI 等工具。但按我目前的使用,检索案例时返回的往往不是裁判全文,而是摘要。不知道是不是我调试的问题。 入门阶段不用急着装一堆 MCP。先把工作目录、CLAUDE.md 和一两个常用 skill 跑顺,等真的需要调用浏览器、数据库、笔记系统时,再去接外部工具。
|
|
副總編 二十三級 |
📚 把材料变成 Agent 能读的东西 法律人的工作,很大一部分是在处理文字。Word、PDF、PPT 这些格式,对人来说很自然,对大模型来说未必友好。模型读 PDF,并不是像人一样看见一本书。技术上通常还是要先把文字抽出来;如果是扫描版,还要先 OCR;如果页面里有表格、分栏、脚注、页眉页脚,还可能要理解版面。人读 PDF 时会自动忽略很多噪音,模型不一定会。 和大模型交互时,最干净的格式还是纯文本,比如 Markdown、txt。标题就是标题,段落就是段落,脚注也可以保留下来。它没有 Word 里的修订痕迹和复杂样式,也没有 PDF 里的分页、分栏和扫描噪点。给 Agent 一个结构清楚的 Markdown 文件,它更容易知道哪里是正文,哪里是脚注,哪里是章节层级。 Markdown 软件推荐 Obsidian、Typora、妙言(MiaoYan)。前两个软件支持显示行号,就是下面图里最左侧的数字。和 Agent 交互时,这个功能很好用。我可以直接说“第 95 行这一段……”,它立刻就能定位,基本是指哪打哪。第三个是github一个独立开发者的产品,设计很有美感,Kami 和 Waza 插件也是他的产品。
|
|
副總編 二十三級 |
🧭 几个常用的场景 前面这些配置,如果不上手实操,听起来还是有点抽象。很多人刚看到 CLAUDE.md、skill、MCP 这些名字,可能已经被吓退了。更麻烦的是,如果没有亲自用它解决过一个真实任务,也很难感受到 Agent 到底能省下多少重复劳动,自然就没有继续探索的动力。下面按几个常见入门场景,说说它大概能帮我做什么,以及用了哪些工具。
① 头脑风暴 对于复杂项目,我现在习惯在动笔前先把问题想清楚。比如 Waza 里的 think,或者 Superpowers 这类插件里的 brainstorm。研究生开题、选论文题目,就很适合把材料给 Agent,让它帮忙梳理:到底想解决什么,手里的材料够不够,哪些判断还拿不准。开始写之前,先把问题、材料和大致结构说清楚,后面会省很多时间。
|
|
副總編 二十三級 |
② 文档处理和展示 PDF、Word、Excel 这些日常文件,Claude Code、Codex 往往已经有一些处理能力,我平时会再搭配 markdown-converter、paddleocr 之类的 skill。这里最明显的效率提升,是把很多格式转换、初步整理、结构搭建的活交给 Agent。我就集中注意力在内容上,最后格式的设置问题,不用再费心。 比如扫描版 PDF 先 OCR 成 Markdown,Word 初稿统一标题层级,Excel 表格先清洗和分类。Markdown 导出 Word,可以走 pandoc,也可以配自定义 Word 模板,像 pandoc_docx_template 这类现成模板可以拿来参考。 最近在尝试把上课用的 PPT 转成 HTML slides。这样我就可以先用 Markdown 写大纲,再让 Agent 转成 HTML slides。试了一两个,效果很不错。用的是 guizang-ppt-skill、Kami 这类工具。
|
|
副總編 二十三級 |
③ 信息检索 对于一般性网页检索,有的 Agent 环境自带 web search,没有的话,也可以按需接 Multi Search Engine、Baidu Search 这类检索 skill。比如之前有学生问,能不能批量检索各地市场监管部门的公告。我当时的做法是先让 Agent 搜集各省市市场监督管理局官网,逐一核对后,再让它在这些网站里检索目标信息。如果这件事以后要定期做,还可以再设计成自动化监测任务。它节省的时间,主要在反复打开网站、换关键词、复制结果这一串机械动作上。 对于给定文献材料的文献问答,我之前用的是腾讯的 IMA,但它的大模型底座感觉不够好,总是有遗漏的信息。现在我最常用的是 NotebookLM,在 Agent 里通过 notebooklm-mcp-cli 这个项目提供的 nlm 工具来调用,不用自己去 NotebookLM 网页。我把论文等文献放进去,基本就能搭一个小型知识库。后面围绕这些材料提问,它会回答并标出来源。 如果是要做一个比较严谨的法律检索,目前没找到成熟的工具。我自己在写 legal-search skill,可能会再配合北大法宝的 MCP 和 CLI,这样可以按法规、案例、专业数据库、公开网站几个层次去核对来源,尽量模仿真实法律检索的步骤。还没有调试完成。尤其是知网这类数据库目前没有特别顺畅的开放入口,很多时候只能让 Agent 借助浏览器去模拟人工检索,稳定性一般。GitHub 上的 OpenCLI 可以把知网操作沉淀成命令,但这类方案需要折腾,也会受到网站登录和反爬机制影响。
|
|
副總編 二十三級 |
④ 文字表达 文字表达、润色层面,用到的是 Humanizer、Humanizer-zh 这类 skill,可以用来去掉 AI 腔,也可以让文字更接近自己的表达习惯。我最近是基于 Waza 项目中 write 这个 skill,修改了一个比较符合自己习惯的 skill。 这些工具目前主要是写公众号文章时会用上。不过我发现,让 AI 起一版草稿以后,即使再润色一遍,还是会留下不少 AI 痕迹,最后还是要自己通读一遍。但工作量已经减轻不少。
|
|
副總編 二十三級 |
|
|