100-young-fire

INPUT: 第一案例（郭宇）从资料采集到思维模型蒸馏的全流程经验

OUTPUT: 第二案例及之后所有人物档案的标准制作流程

POS: 100 个财富自由年轻人项目的方法论顶层文档

title: 100 财富自由年轻人 · 人物档案制作流程版本: v1（基于第一案例郭宇沉淀）创建日期: 2026-05-10 适用范围: 100 个财富自由年轻人系列所有后续案例 —

一句话总纲

原料质量 → 事实层 → 抽象层。三段式，不能跳，不能混。

跳过原料质量，事实层就是垃圾；事实层和抽象层混在一起，用户读不动也没法验证。

流程鸟瞰

阶段 1                阶段 2              阶段 3              阶段 4
[7 维度资料采集]  →  [交叉验证勘误]  →  [事实层 HTML]  →  [抽象层 HTML]
   原料                  净化                可视化              蒸馏

每个阶段都有交付物，前一阶段的交付物是下一阶段的输入。不要并行——并行会让事实层抢进度、抽象层流于金句。

阶段 1：资料采集 · 7 维度

目标：建立可交叉验证的原料库。

7 个维度（强制全做）

#	维度	采什么	为什么必要
01	人生自述	第一人称语录、博客、推特原文	一手中的一手，最高可信度
02	访谈精华	媒体专访、播客、公开演讲	一手 + 时间跨度，看观点演变
03	日常动态	社交媒体、生活碎片	反”完美叙事”，看真实状态
04	他人视角	朋友博客、媒体观察、社会讨论	反”自我美化”，看反差
05	关键决策链	人生重大节点的动机/过程/反思	蒸馏的原料
06	财富/事业时间线	财务积累/职业进展节点	硬数据
07	数字与证据	可验证硬事实（生日/工号/GitHub）	反”网传谣言”，建立锚点

元数据强制标准

每条信息必须带：

内容（具体事实/语录）
来源 URL（不能写”网络”/”采访”）
可信度（一手 / 二手）
时间（采集到的版本，不是发布时间）

判定规则：

一手 = 本人亲述（采访录音/博客/推特原文/直接受访）
二手 = 媒体编辑后的报道、转引、归纳

黑名单源（不引用）

知乎、微信公众号、百度百科。原因：内容农场化、来源不明、错误率高。

⚠️ 不可商量。即使是”看起来对”的知乎答案也不引用——验证它需要的成本超过重新查证。

阶段 1 交付物

XXX_资料收集/references/research/01-人生自述.md 至 07-数字与证据.md。每份带 frontmatter（维度/采集日期/来源说明）。

阶段 2：交叉验证 · 勘误

目标：找出 7 维度之间的矛盾，用可信度层级裁决，留下勘误记录。

触发条件

7 维度全部完成。不要边采边验——会让你过早收敛某个版本。

找矛盾的方法

跨文件搜同一事实点（出生地、家庭背景、关键时间、关键金额），列出每份文件的说法。

第一案例真实出现的矛盾：

出生地：江西矿山小镇 vs 湖南小城（4 处文件不一致）

父亲职业：电工 vs 公务员

父亲卧床原因：事故 vs 心血管疾病

是否搬硅谷：05 文件说 2024 年搬了，03 文件 Twitter 显示持续居住日本

裁决规则（可信度层级）

本人自述（一手） > 多源交叉一致（一手×2+） > 一手专访 > 二手报道

矛盾时：取一手自述 / 多源一致那一边
当本人不同时期说法不同时：取最近的（人会修正自己）
当所有源都一致但反直觉时：标记，别推翻

阶段 2 交付物

勘误记录（最终进入事实层 HTML 的”勘误章节”），格式：

[争议点] → [选定的版本] [可信度标签] [来源]
[被否决的版本] [来源] [否决理由]

⚠️ 必须保留被否决的版本和否决理由。这是给用户的诚信凭证，不是”洁癖式擦除”。

阶段 3：事实层可视化 · 人生路线图

目标：把验证后的事实做成 HTML，让普通人能在 5 分钟内扫完一个人。

必含模块

Hero 顶部：姓名 + 一句话人生轨迹 + 关键身份标签
时间线：6-8 个人生阶段（不要 20+ 个琐碎节点），每条事件带可信度标签
关键数字：硬事实卡片网格（生日 / 学历 / 工号 / GitHub / 财务节点）
勘误章节：阶段 2 的产出，带删除线显示被否决版本
一句话哲学：本人最有代表性的一句

加分模块（如果用户主动问）

如果用户问 “年轻人关注什么、怎么实现的、如果我们到现在怎么选”—— 可在事实层 HTML 里追加：

路径拆解（财富积累的几重叠加）
决策模式（做对了什么）
可复制矩阵（不可复制 / 可复制 / 新窗口三列对比）

第一案例做了这块，效果不错。但不要主动加——等用户提问再加，避免抢抽象层的位置。

视觉规范

暗色系（#0f0f0f 背景）、卡片化、单栏 800px 宽度、移动端响应式。每条事实必有可信度色标（绿=一手 / 黄=二手）。

阶段 3 交付物

XXX_资料收集/XXX_人生路线图.html

阶段 4：抽象层蒸馏 · 思维模型

目标：从事实里蒸馏出可迁移的思维模型，让用户看完能用在自己身上。

触发条件

用户主动提出 “思维模型 / 为什么这样想 / 怎么做决策 / 信仰什么 / 起点逻辑” 类问题。

⚠️ 不要主动启动这个阶段。井九原话：”AI 时代更重要的是这个人的思维模型”——这是用户驱动的抽象升级，不是默认产出。

蒸馏的三层 OS 架构

顶部：3 条元规则（贯穿全 OS 的核心命题）
  L3 决策层：怎么做选择？4 条决策原则
  L2 信仰层：相信什么？4 条价值锚点
  L1 起源层：为什么从那里开始？4 条入场哲学
底部：AI 时代实操映射 + 蒸馏边界 caveat

为什么是 stack 不是并列：起源决定信仰，信仰决定决策。把它们当三层叠加，OS 解释力强；当 3 个孤立列表，就是金句集。

蒸馏质量的检验工具

每条原则必须能写出 “默认做法 vs 本人做法”两栏对比表。

写得出 → 是真洞察
写不出 → 是金句，删掉重做

例子（来自郭宇）： | 默认做法 | 郭宇做法 | |—|—| | 等”找到热爱”才开始投入 | 被生存压力推上编程，热情后置长出 |

元规则提炼

12 条原则蒸馏完成后，找贯穿性的 3 条元规则放顶部。第一案例的元规则：

“够”代替”最大化”
环境 > 努力
减法先于加法

必含 caveat

诚实标注哪些是本人明说的、哪些是从行为归纳的隐含规则。不要冒充”本人认证”。

AI 时代实操映射

把 12 条原则一对一映射到当下场景。这是井九做整个项目的真正目的——人物只是载体，模型是产品。

阶段 4 交付物

XXX_资料收集/XXX_思维模型.html

关键判断点（避免偏航）

矛盾出现 → 用可信度层级裁决，不要模糊处理或两边都写
事实层 vs 抽象层 → 独立 HTML，不要混在一起
抽象层是用户驱动的 → 不要在事实层完成时就主动开始蒸馏
蒸馏的检验 → 写不出 vs 表格的原则，就是金句不是洞察
caveat 必加 → 区分明说和归纳，保留诚信凭证

第一案例的避坑清单

❌ 不要先想”做漂亮 HTML” → 会跳过资料质量
❌ 不要资料没元数据就堆积 → 后期无法交叉验证
❌ 不要事实和抽象混 HTML → 用户读不动也没法验证
❌ 不要用平铺金句蒸馏 → 看起来都对，没有指导价值
❌ 不要假装”本人认证”归纳出的规则 → 失去信任就全盘崩

第二案例（孙宇晨）反哺：来源池设计阶段的 5 条避坑

第二案例阶段 2 交叉验证发现：在 brainstorming 阶段我（Claude）设定的”来源池清单”本身就有 5 处错误，被 7 个采集子代理主动纠正。这些错误规律性强，提炼为后续案例的来源池自检规则。

规则 1：英文媒体广泛流传 ≠ 真实

典型陷阱：孙宇晨案中，英文媒体多处把湖畔大学 2018 毕业论文《The Birth of a Decentralized Internet》误传为”宾大东亚研究硕士论文”
机制：同一误源被层层转引，多源一致 ≠ 多源独立验证
应用：来源池中”本人著作 / 学术作品”每一份都必须确认归属（学校 / 时间 / 全文获取性），而不是接受英文圈的标签

规则 2：头衔类信息必须找机构 / 政府官方公告

典型陷阱：孙宇晨案中，”中央党校客座教授 / 教学职位”网传 → 实际只有 1 篇《学习时报》文 + 1 个校级课题副组长
机制：”教授 / 大使 / 客座 / 顾问”等头衔最容易被营销夸大
应用：来源池中所有”任命 / 职位 / 头衔”信息，必须标”待官方公告确认”，否则 HTML 阶段不得作为事实呈现

规则 3：同名品牌的多个法人主体要分清

典型陷阱：孙宇晨”锐波”品牌下有 2 个公司主体——广州锐波信息技术（孙 100% 持股，最早）+ 北京锐波天下→陪我欢乐（后期主体），来源池误把后者当早期主体
机制：媒体描述常用品牌名，省略法人主体差异
应用：来源池中”在 X 城市创办 Y 公司”的描述，必须用工商注册数据库（国家企业信用公示系统 / 企查查）核实，不接受媒体口径

规则 4：本人微博 / 推特原文 ≠ 媒体转述版本

典型陷阱：孙宇晨案中，来源池写”巴菲特午餐’胃病’放鸽子”，本人微博原文是”肾结石”
机制：传播过程中”症状”经常被简化或讹传
应用：本人说过的话必须找到原帖 URL（推特 / 微博 / 博客），不要用”传播版本”。来源池中本人引语都标注原帖链接

规则 5：相邻 / 类似国家的身份信息容易被混为一谈

典型陷阱：孙宇晨案中，来源池写”多米尼克 + 格林纳达驻 WTO 代表”，实际只有格林纳达任命，多米尼克无任何证据
机制：加勒比 / 太平洋小国名容易混淆，投资入籍国清单中”似是而非”的关联会被误传
应用：涉及多个相似实体（小国 / 投资入籍 / 政治外交身份）必须逐个核实，不接受”X + Y”的合并表述

自检方式

在阶段 1 启动前，对照这 5 条规则自检来源池清单。同时在子代理 prompt 中加入指令：”主动标注并纠正你发现的来源池误标“——孙宇晨案中 7 个 agent 全部主动纠错过，证明该指令有效。

第二案例启动 Checklist

□ 选定人物
□ 收集来源池（含 Twitter/博客/采访 URL 列表）
□ 检查来源数量是否够（少于 5 个一手源 → 该人物可能不适合做档案）
□ 阶段 1：7 维度采集 → 7 个 .md 文件
□ 阶段 2：交叉验证 → 勘误清单
□ 阶段 3：人生路线图 HTML
□ 等用户提问触发抽象层
□ 阶段 4：思维模型 HTML（如果触发）
□ 更新本流程文档（如果发现新模式或新坑）

应弹性处理的场景

资料量稀少的人物（不爱采访的人）：7 维度可能合并，但 01 自述 + 04 他人视角 + 07 硬事实是底线，不能少。
没有明显矛盾的人物：阶段 2 不一定有”勘误”产出，可改为”多源一致性证据清单”。
思维模型本身平庸：不是所有人物都值得做思维模型。如果这个人就是”主流路径”代表（北大→投行→咖啡馆），抽象层可以不做，老实承认。
超出 100 人主题的人物：本流程也可用，但元规则要改（”财富自由”换成新主题轴）。

文件命名约定（按 CLAUDE.md）

资料目录：XXX_资料收集/（XXX = 人物名）
研究材料：references/research/01-人生自述.md 至 07-数字与证据.md
事实层：XXX_资料收集/XXX_人生路线图.html
抽象层：XXX_资料收集/XXX_思维模型.html

修订记录

2026-05-10 v1：基于第一案例郭宇沉淀创建
2026-05-11 v2：基于第二案例孙宇晨阶段 2 反哺，新增「来源池设计避坑」章节（5 条规则 + 子代理纠错指令）
下次修订：第三案例完成后回顾，发现新模式或坑则更新

This site is open source. Improve this page.