Qwen1.5B + QLoRA 情緒分類模型改善實驗:超參數調整與欠擬合分析
評估結果如下,這是按照生成的數據進行訓練並進行測試給出的結果:
| - | precision | recall | f1-score | support |
|---|---|---|---|---|
| 喜悅 | 0.79 | 1.00 | 0.88 | 11 |
| 悲傷 | 0.44 | 1.00 | 0.62 | 8 |
| 憤怒 | 1.00 | 0.40 | 0.57 | 10 |
| 恐懼 | 1.00 | 0.11 | 0.20 | 9 ← 幾乎全错 |
| 驚訝 | 0.75 | 0.75 | 0.75 | 8 |
| 厭惡 | 0.83 | 0.62 | 0.71 | 8 |
| macro avg | 0.80 | 0.65 | 0.62 | 54 |
下面是評估結論
| 指標 | 結果 | lab目標 | 達標 |
|---|---|---|---|
| Macro F1 | 0.62 | ≥0.75 | ❌ |
| Accuracy | 0.65 | ≥0.80 | ❌ |
| 推理延遲中位數 | 178ms | ≤500ms | ✅ |
| 最容易混淆 | 恐懼 ↔ 悲傷(5 次) | — | — |