100-young-fire

INPUT: 第一案例(郭宇)从资料采集到思维模型蒸馏的全流程经验

OUTPUT: 第二案例及之后所有人物档案的标准制作流程

POS: 100 个财富自由年轻人项目的方法论顶层文档


title: 100 财富自由年轻人 · 人物档案制作流程 版本: v1(基于第一案例 郭宇 沉淀) 创建日期: 2026-05-10 适用范围: 100 个财富自由年轻人系列所有后续案例 —

一句话总纲

原料质量 → 事实层 → 抽象层。三段式,不能跳,不能混。

跳过原料质量,事实层就是垃圾;事实层和抽象层混在一起,用户读不动也没法验证。


流程鸟瞰

阶段 1                阶段 2              阶段 3              阶段 4
[7 维度资料采集]  →  [交叉验证勘误]  →  [事实层 HTML]  →  [抽象层 HTML]
   原料                  净化                可视化              蒸馏

每个阶段都有交付物,前一阶段的交付物是下一阶段的输入。不要并行——并行会让事实层抢进度、抽象层流于金句。


阶段 1:资料采集 · 7 维度

目标:建立可交叉验证的原料库。

7 个维度(强制全做)

# 维度 采什么 为什么必要
01 人生自述 第一人称语录、博客、推特原文 一手中的一手,最高可信度
02 访谈精华 媒体专访、播客、公开演讲 一手 + 时间跨度,看观点演变
03 日常动态 社交媒体、生活碎片 反”完美叙事”,看真实状态
04 他人视角 朋友博客、媒体观察、社会讨论 反”自我美化”,看反差
05 关键决策链 人生重大节点的动机/过程/反思 蒸馏的原料
06 财富/事业时间线 财务积累/职业进展节点 硬数据
07 数字与证据 可验证硬事实(生日/工号/GitHub) 反”网传谣言”,建立锚点

元数据强制标准

每条信息必须带:

判定规则:

黑名单源(不引用)

知乎、微信公众号、百度百科。原因:内容农场化、来源不明、错误率高。

⚠️ 不可商量。即使是”看起来对”的知乎答案也不引用——验证它需要的成本超过重新查证。

阶段 1 交付物

XXX_资料收集/references/research/01-人生自述.md07-数字与证据.md。每份带 frontmatter(维度/采集日期/来源说明)。


阶段 2:交叉验证 · 勘误

目标:找出 7 维度之间的矛盾,用可信度层级裁决,留下勘误记录。

触发条件

7 维度全部完成。不要边采边验——会让你过早收敛某个版本。

找矛盾的方法

跨文件搜同一事实点(出生地、家庭背景、关键时间、关键金额),列出每份文件的说法。

第一案例真实出现的矛盾:

裁决规则(可信度层级)

本人自述(一手) > 多源交叉一致(一手×2+) > 一手专访 > 二手报道

阶段 2 交付物

勘误记录(最终进入事实层 HTML 的”勘误章节”),格式:

[争议点] → [选定的版本] [可信度标签] [来源]
[被否决的版本] [来源] [否决理由]

⚠️ 必须保留被否决的版本和否决理由。这是给用户的诚信凭证,不是”洁癖式擦除”。


阶段 3:事实层可视化 · 人生路线图

目标:把验证后的事实做成 HTML,让普通人能在 5 分钟内扫完一个人。

必含模块

  1. Hero 顶部:姓名 + 一句话人生轨迹 + 关键身份标签
  2. 时间线:6-8 个人生阶段(不要 20+ 个琐碎节点),每条事件带可信度标签
  3. 关键数字:硬事实卡片网格(生日 / 学历 / 工号 / GitHub / 财务节点)
  4. 勘误章节:阶段 2 的产出,带删除线显示被否决版本
  5. 一句话哲学:本人最有代表性的一句

加分模块(如果用户主动问)

如果用户问 “年轻人关注什么、怎么实现的、如果我们到现在怎么选”—— 可在事实层 HTML 里追加:

第一案例做了这块,效果不错。但不要主动加——等用户提问再加,避免抢抽象层的位置。

视觉规范

暗色系(#0f0f0f 背景)、卡片化、单栏 800px 宽度、移动端响应式。每条事实必有可信度色标(绿=一手 / 黄=二手)。

阶段 3 交付物

XXX_资料收集/XXX_人生路线图.html


阶段 4:抽象层蒸馏 · 思维模型

目标:从事实里蒸馏出可迁移的思维模型,让用户看完能用在自己身上。

触发条件

用户主动提出 “思维模型 / 为什么这样想 / 怎么做决策 / 信仰什么 / 起点逻辑” 类问题。

⚠️ 不要主动启动这个阶段。井九原话:”AI 时代更重要的是这个人的思维模型”——这是用户驱动的抽象升级,不是默认产出。

蒸馏的三层 OS 架构

顶部:3 条元规则(贯穿全 OS 的核心命题)
  L3 决策层:怎么做选择?4 条决策原则
  L2 信仰层:相信什么?4 条价值锚点
  L1 起源层:为什么从那里开始?4 条入场哲学
底部:AI 时代实操映射 + 蒸馏边界 caveat

为什么是 stack 不是并列:起源决定信仰,信仰决定决策。把它们当三层叠加,OS 解释力强;当 3 个孤立列表,就是金句集。

蒸馏质量的检验工具

每条原则必须能写出 “默认做法 vs 本人做法”两栏对比表

例子(来自郭宇): | 默认做法 | 郭宇做法 | |—|—| | 等”找到热爱”才开始投入 | 被生存压力推上编程,热情后置长出 |

元规则提炼

12 条原则蒸馏完成后,找贯穿性的 3 条元规则放顶部。第一案例的元规则:

  1. “够”代替”最大化”
  2. 环境 > 努力
  3. 减法先于加法

必含 caveat

诚实标注哪些是本人明说的、哪些是从行为归纳的隐含规则。不要冒充”本人认证”

AI 时代实操映射

把 12 条原则一对一映射到当下场景。这是井九做整个项目的真正目的——人物只是载体,模型是产品。

阶段 4 交付物

XXX_资料收集/XXX_思维模型.html


关键判断点(避免偏航)

  1. 矛盾出现 → 用可信度层级裁决,不要模糊处理或两边都写
  2. 事实层 vs 抽象层 → 独立 HTML,不要混在一起
  3. 抽象层是用户驱动的 → 不要在事实层完成时就主动开始蒸馏
  4. 蒸馏的检验 → 写不出 vs 表格的原则,就是金句不是洞察
  5. caveat 必加 → 区分明说和归纳,保留诚信凭证

第一案例的避坑清单


第二案例(孙宇晨)反哺:来源池设计阶段的 5 条避坑

第二案例阶段 2 交叉验证发现:在 brainstorming 阶段我(Claude)设定的”来源池清单”本身就有 5 处错误,被 7 个采集子代理主动纠正。这些错误规律性强,提炼为后续案例的来源池自检规则。

规则 1:英文媒体广泛流传 ≠ 真实

规则 2:头衔类信息必须找机构 / 政府官方公告

规则 3:同名品牌的多个法人主体要分清

规则 4:本人微博 / 推特原文 ≠ 媒体转述版本

规则 5:相邻 / 类似国家的身份信息容易被混为一谈

自检方式

在阶段 1 启动前,对照这 5 条规则自检来源池清单。同时在子代理 prompt 中加入指令:”主动标注并纠正你发现的来源池误标“——孙宇晨案中 7 个 agent 全部主动纠错过,证明该指令有效。


第二案例启动 Checklist

□ 选定人物
□ 收集来源池(含 Twitter/博客/采访 URL 列表)
□ 检查来源数量是否够(少于 5 个一手源 → 该人物可能不适合做档案)
□ 阶段 1:7 维度采集 → 7 个 .md 文件
□ 阶段 2:交叉验证 → 勘误清单
□ 阶段 3:人生路线图 HTML
□ 等用户提问触发抽象层
□ 阶段 4:思维模型 HTML(如果触发)
□ 更新本流程文档(如果发现新模式或新坑)

应弹性处理的场景


文件命名约定(按 CLAUDE.md)


修订记录