分類 AI 下的文章

OSM 的隱藏陷阱：λ 指數修正 2 —— 建照數據校準與方法論局限

Jkeeper
2026-07-19
CV
0 則評論

延續上一篇的話題，關於 λ 的修正計算，如何更準確的預估或是計算出 λ 呢？

理論上 λ 應由「外部基準」決定，以下是三條可行的校準路徑：

PATH 1：對照官方建照數據

最直接的方法——以政府公布的「年度核發建照數」作為 ground truth，反推 λ：

λ* = log(N_t/N_0 / G_real) / log(C_t/C_0)

其中 G_real 為官方建照累計增長率。台中建管處（CPA）有公開資料，可據此反算出城市特定的 λ 值。

PATH 2：跨城市穩定性檢驗

若同一個 λ 值應用於台北、高雄、台中均能與官方數據對齊，則可視其為 OSM 系統性偏差的穩健估計，與個別城市無關。

- 閱讀剩餘部分 -

LLM 記憶壓縮實戰：滑動視窗 vs 摘要記憶，用答對率與 Token 成本量化取捨

Jkeeper
2026-07-14
LLM
0 則評論

本章節要實作滑動視窗與摘要壓縮兩種記憶，並用事實問答量化「省 token vs 記得住」的取捨

一、滑動視窗記憶

實作只保留最近 N 輪的 `SlidingWindowMemory`，並驗證在 Context Window 中「忘掉久遠的事」

- 閱讀剩餘部分 -

LLM 為什麼沒有記憶？Stateless 原理與 Prompt 層記憶模擬實戰（含 Token 成長曲線）

Jkeeper
2026-07-13
LLM
0 則評論

一、大模型沒有記憶

由於 LLM 本質上是無狀態的（Stateless）。每一次 API 呼叫都是獨立的、全新的計算過程，模型內部不會保留任何「記住上一句話」的狀態。因此，兩次呼叫彼此獨立，第二次完全不知道第一次發生過的事情。於是乎就有了以下的做法。

Prompt 層模擬記憶

把「歷史聊天記錄」+「當前新問題」打包拼接，作為一個完整的 Prompt 一次性傳給模型，讓它在 單次推理中 看到全部上下文。

我們會把對話歷史塞進 context 中，如下：

- 閱讀剩餘部分 -

Prompt Engineering 實戰：Zero-shot vs Few-shot vs CoT 的 Token 成本與情感分析對比

Jkeeper
2026-07-12
LLM
0 則評論

「將原始模型輸出轉化為結構化、可靠、可預測的行為」。這是 prompt engineering 的工程定義。其中三個層次：

策略：zero-shot / few-shot / Chain-of-Thought — 用什麼方式引導模型推理
約束：JSON mode、schema、格式規範 — 讓輸出可被程式接住
曡代：用標註資料集量化準確率，像調程式一樣調 prompt

Context Engineering（上下文工程）：重點不是單句 prompt，而是「在有限 context window 裡，放對的範例、對的格式說明、對的歷史」。

- 閱讀剩餘部分 -

OSM 的隱藏陷阱 - 以 λ 指數修正志願者貢獻偏差

本篇要講述的是台中 OSM 建築數量 2018→2025 增長 392%，但其中有多少是真實建設、多少是社群回填？本篇提出一個可量化、可控制修正強度的 λ 偏差修正指數。

關於 OSM 其中的 392% 增長，有多少是真的？

先來檢視台中市 OSM 數據 8 年的原始增長：

年份	OSM 建築物總數	設施	商店	休閒
2018	16,926	1,015	408	30
2019	12,771	1,207	466	32
2020	16,117	1,520	541	39
2021	18,500	1,599	534	47
2022	24,973	1,640	590	49
2023	41,055	1,762	647	57
2024	47,584	1,874	690	59
2025	50,208	1,921	705	61

採樣點 500m 範圍內的「平均建築數量」更為顯著——從 2018 年的 27.6 棟，增至 2025 年的 136 棟，+392.1%。

- 閱讀剩餘部分 -

分類 AI 下的文章

OSM 的隱藏陷阱：λ 指數修正 2 —— 建照數據校準與方法論局限

延續上一篇的話題，關於 λ 的修正計算，如何更準確的預估或是計算出 λ 呢？

PATH 1：對照官方建照數據

PATH 2：跨城市穩定性檢驗

LLM 記憶壓縮實戰：滑動視窗 vs 摘要記憶，用答對率與 Token 成本量化取捨

本章節要實作滑動視窗與摘要壓縮兩種記憶，並用事實問答量化「省 token vs 記得住」的取捨

實作只保留最近 N 輪的 SlidingWindowMemory，並驗證在 Context Window 中「忘掉久遠的事」

LLM 為什麼沒有記憶？Stateless 原理與 Prompt 層記憶模擬實戰（含 Token 成長曲線）

Prompt 層模擬記憶

我們會把對話歷史塞進 context 中，如下：

Prompt Engineering 實戰：Zero-shot vs Few-shot vs CoT 的 Token 成本與情感分析對比

「將原始模型輸出轉化為結構化、可靠、可預測的行為」。 這是 prompt engineering 的工程定義。其中三個層次：

OSM 的隱藏陷阱 - 以 λ 指數修正志願者貢獻偏差

關於 OSM 其中的 392% 增長，有多少是真的？

最新文章

分類

實作只保留最近 N 輪的 `SlidingWindowMemory`，並驗證在 Context Window 中「忘掉久遠的事」

「將原始模型輸出轉化為結構化、可靠、可預測的行為」。這是 prompt engineering 的工程定義。其中三個層次：