用統計說話:Chi² 適合度檢定驗證彩球號碼是否真正隨機
01 · 彩票的隨機數真的隨機嗎?讓我們用 Chi² 來查詢分析資料
彩票開到現在,將近 1900 期、總共開出 11400 顆主號碼球。如果機器是公平的,理論上 1-38 號每個號碼應該出現約 300 次 左右。
如果某個號碼出現了 335 次(比期望多 35 次),這算正常的隨機波動,還是機器有問題?
憑直覺很難判斷。30 次差距聽起來不少,但攤在 1900 期裡又似乎還好。
這正是 Chi² 適合度檢定 要解決的問題:它把「直覺判斷」變成「可量化的 p-value」。
2. 看看結果

圖裡會看到 1-38 號的出現次數長條圖,紅色是出現偏多、藍色偏少、綠色正常。眼睛掃一眼會覺得「有點高低不平」,但這種起> > 伏到底算不算過分?看下面的 chi² 數字。
下面是執行輸出
========== 彩球 ==========
總期數 : 1891
主號碼範圍 : 1-38(每期取 6 個)
特別號範圍 : 1-8
主號碼 Chi-Square
chi² = 33.0072
p-value = 0.6568
判定 : 接受均勻假設
特別號 Chi-Square
chi² = 9.4082
p-value = 0.2247
判定 : 接受均勻假設
========== 樂透球 ==========
總期數 : 1252
主號碼範圍 : 1-49(每期取 6 個)
特別號範圍 : 1-49
主號碼 Chi-Square
chi² = 26.4595
p-value = 0.9951
判定 : 接受均勻假設
特別號 Chi-Square
chi² = 59.4936
p-value = 0.1235
判定 : 接受均勻假設
Chi² 的用途
想像你有一張清單,列出每個號碼「實際出現了幾次」(簡稱 O,Observed)和「理論該出現幾次」(簡稱 E,Expected)。
Chi² 就是把每個號碼的「差距」平方後加總:
「差距 ÷ 期望值」 平方再加起來。差越大、分數越高;分數越高,越像有鬼。
因為差距有正有負,直接加會互相抵消,平方後保留所有差距大小,越大的偏差懲罰越重。而除以期望值做標準化。
4. 公式

| 符號 | 意思 |
|---|---|
| Oi | 第 $i$ 個號碼實際出現次數 |
| Ei | 第 $i$ 個號碼理論期望次數 |
| k | 號碼總數(彩球主號碼 k=38) |
期望值怎麼算? 對彩球主號碼:

(每期開 6 個球,平均分給 38 個號碼。)
判定規則:算出 chi² 後,查 chi² 分布表得到 p-value:
- p > 0.05:差異還在隨機波動範圍內,接受「機器是公平的」假設
- p < 0.05:差異太大,已經不像隨機,拒絕假設(懷疑機器有偏)
結論
- 如果 p-value 都遠大於 0.05(例如 0.1 ~ 0.9),代表數據看起來夠隨機
- 如果 p-value < 0.05,是樣本量還不夠造成的偽陽性,還是真的有問題?
Chi² 是檢驗「整體分布是否均勻」的入門工具,用一個數字(p-value)告訴你「眼睛看到的不平均」是不是真的不平均。
但不能拿來預測下次開出來的彩球原因如下:
- Chi² 是描述性的:它只告訴你「過去的整體分布像不像隨機」,沒講未來該選哪個號碼。
- 彩票每期獨立:就算某號碼歷史出現偏多,下期它出現的機率仍是 6/38,跟其他號碼一樣。過去的偏差不會「補回來」也不會「延續下去」(這正是賭徒謬誤的反面)。
Chi² 的主要用途
- 作為起點:先確認「整體上是隨機的」,才有資格往下做更細的分析(間距、共現、週期)
- 作為對照組:當你看到某個「異常模式」,先用 Chi² 確認它是不是只是隨機波動的假象
- 作為造假偵測:如果 chi² 太小(過度均勻),反而是異常——這是文章 04 的主題