今天來看下這篇文章,第一次看的時候沒意識到重要性,後來看某個面試官在闡述 agent 工程師的區別時特地説到這篇文章才想起來

Anthropic building-effective-agents


Anthropic 觀察了幾十個在生產環境落地的 LLM 系統,發現一個反直覺的規律:最成功的實作往往不是用最複雜的框架,而是用最簡單、可組合的模式。

他們把所有涉及 LLM 自主行動的系統統稱為 agentic system,但在這個概念下做了一個關鍵的架構區分——

03820-hnvwfyrbxcr.png

- 閱讀剩餘部分 -

過度均勻才是真異常,這個看似微妙的論點正是本章節要説明的重點

1936 年,統計學之父 Fisher 質疑遺傳學之父 Mendel 的豌豆實驗造假。
證據不是數據「太不規律」,而是「太完美」。
這個方法後來也用在彩票造

81085-cj2ys3q27kl.png

圖裡有 4 個子檢驗:

  • [A] Dispersion Index:觀測方差 / 理論方差,比值 < 1 就是過度均勻
  • [B] Monte Carlo Chi² 百分位:實際 chi² 比多少比例的純隨機更小?百分位 > 95% 就是強烈過度均勻
  • [C] 分段一致性:把資料切 10 段,看段間波動。波動太小 = 各時段過度一致
  • [D] 滑動視窗 Chi²:用 50 期的窗口逐期掃,看 chi² 序列的時間變化

- 閱讀剩餘部分 -

session保存格式結構如下:
84171-0j50xl0z9ulr.png

json格式化如下:
96351-8qclkt3iwr.png

為什麼選擇 JSONL?

Claude Code 沒有使用資料庫,而是選擇了最簡單的格式:每個 session 一個 .jsonl 檔案,每行一條 JSON 訊息。

比較面向 JSONL 格式 關聯式資料庫
讀取方式 任何文字編輯器、cat 需要 DB 驅動
追加速度 極快(append-only) 需要 transaction
查詢能力 低(需全掃) 高(SQL)
跨機器遷移 複製檔案即可 需要 dump/restore
故障恢復 行級別,單行壞掉不影響其他行 依賴 transaction log
版本控制 可用 git 追蹤 不適合

結論:AI 對話是只增不改、需要人類可讀、不需要複雜查詢的應用場景,所以JSONL 是最合適的選擇。

- 閱讀剩餘部分 -

先問個問題,彩球從 38 個號碼中抽 6 個,理論上每組會出現「連號對」(兩個相鄰的數字)的機率是多少,平均每期會出現幾對連號?0.5?1?2?

很多人會猜「應該很少,大概 0.2 對左右」。理由很直觀:38 個選 6 個,平均每個號碼之間應該隔 38/6 ≈ 6 格,連號感覺很稀有。

但這個直覺是錯的。連號其實非常常見,平均每期會出現超過 0.8 對。


40652-pxkr28wyeok.png

- 閱讀剩餘部分 -