Claude Code 效率分析指標工具開發實作:Session 評分與效率報告生成
Workflow vs Agent 架構解析:Anthropic Building Effective Agents 重點整理
今天來看下這篇文章,第一次看的時候沒意識到重要性,後來看某個面試官在闡述 agent 工程師的區別時特地説到這篇文章才想起來
Anthropic building-effective-agents
Anthropic 觀察了幾十個在生產環境落地的 LLM 系統,發現一個反直覺的規律:最成功的實作往往不是用最複雜的框架,而是用最簡單、可組合的模式。
他們把所有涉及 LLM 自主行動的系統統稱為 agentic system,但在這個概念下做了一個關鍵的架構區分——

過度均勻才是真異常:用四種統計檢驗偵測隨機數造假
過度均勻才是真異常,這個看似微妙的論點正是本章節要説明的重點
1936 年,統計學之父 Fisher 質疑遺傳學之父 Mendel 的豌豆實驗造假。
證據不是數據「太不規律」,而是「太完美」。
這個方法後來也用在彩票造

圖裡有 4 個子檢驗:
- [A] Dispersion Index:觀測方差 / 理論方差,比值 < 1 就是過度均勻
- [B] Monte Carlo Chi² 百分位:實際 chi² 比多少比例的純隨機更小?百分位 > 95% 就是強烈過度均勻
- [C] 分段一致性:把資料切 10 段,看段間波動。波動太小 = 各時段過度一致
- [D] 滑動視窗 Chi²:用 50 期的窗口逐期掃,看 chi² 序列的時間變化
Claude Code Token 費用分析:費用計算、工具統計與 Web Dashboard 實作
這個章節要説明關於 Claude Code Analytics 的部分内容
計算 token 費用、分析工具使用模式、建立 Web Dashboard
首先加入 Token 計算器
這邊要查詢所有 session,計算每個 session 的 token 用量與美金費用
新增費用計算模組
新增 lib/costs.mjs: