SSIM vs ResNet 餘弦距離:兩種跨年變化偵測方法的取捨
系列 B 第二篇:量化「兩個年份之間城市變了多少」有兩條主流路徑——SSIM 著重結構相似度,ResNet 著重語義變化。本篇拆解兩者各自的擅長領域,並以實際數據示範何時應同時採用兩個指標。
一、為何需要「跨年變化偵測」
前一篇介紹的三個指標(邊緣密度、建築覆蓋率、紋理熵)屬於單幀指標——每張影像獨立計算一個數值。
然而研究城市發展時,真正想回答的問題是「這個地點從 2018 到 2025 發生了多大的變化」。最直覺的做法是差分(metric_2025 - metric_2018),但此方式有一個根本限制:
兩張影像的 edge_density 同樣是 0.18,差值為零——但實際上整片區域可能已完全重建,只是新舊建築的邊緣密度恰好相同。
差分丟失了「像素級的對應關係」。需要的是直接比對兩張影像本身的方法。
主流有兩條路徑:
| 方法 | 偵測對象 | 計算成本 | 可解釋性 |
|---|---|---|---|
| SSIM | 結構相似度(像素對應) | 低(CPU 即可) | 高 |
| ResNet 餘弦距離 | 語義相似度(特徵對應) | 中(一次 forward pass) | 中 |
兩者並非替代關係,而是互補。



