分類 AI 下的文章

使用 Qwen2.5B + QLoRA 情緒分類模型改善實驗：擴增資料集至 500~800 筆後 Macro F1 達 0.74

Jkeeper
2026-06-27
LLM
0 則評論

之前使用 kimi 生成約200筆數據，這次將數據量提高到 500~800 筆，再次進行訓練、測試，結果如下

Macro F1 = 0.74(三輪:0.62 → 0.57 → 0.74)，Accuracy 0.76。

-	precision	recall	f1-score	support
喜悅	0.90	0.90	0.90	21
悲傷	1.00	0.80	0.89	20
憤怒	0.93	0.59	0.72	22 ← 從 recall 0 救回
恐懼	0.74	0.95	0.83	21 ← 從 recall 0.11 救回
驚訝	0.67	0.29	0.40	14 ← 新的弱點
厭惡	0.54	0.90	0.68	21
macro avg	0.80	0.74	0.74	119

- 閱讀剩餘部分 -

使用 Qwen2.5B + QLoRA 情緒分類模型改善實驗：超參數調整與欠擬合分析

Jkeeper
2026-06-25
LLM
0 則評論

評估結果如下，這是按照生成的數據進行訓練並進行測試給出的結果:

-	precision	recall	f1-score	support
喜悅	0.79	1.00	0.88	11
悲傷	0.44	1.00	0.62	8
憤怒	1.00	0.40	0.57	10
恐懼	1.00	0.11	0.20	9 ← 幾乎全错
驚訝	0.75	0.75	0.75	8
厭惡	0.83	0.62	0.71	8
macro avg	0.80	0.65	0.62	54

下面是評估結論

指標	結果	lab目標	達標
Macro F1	0.62	≥0.75	❌
Accuracy	0.65	≥0.80	❌
推理延遲中位數	178ms	≤500ms	✅
最容易混淆	恐懼 ↔ 悲傷(5 次)	—	—

- 閱讀剩餘部分 -

使用 Qwen2.5B + QLoRA 微調情緒分類模型：訓練流程與評估結果實作

Jkeeper
2026-06-25
LLM
0 則評論

下面將每筆資料透過 _to_chat_text(...) 組成 ChatML 風格輸入

def _to_chat_text(tokenizer, instruction, user_input, output=None):
    """組成 ChatML 訓練 / 推理文本。output 為 None 時只到 assistant 起始。"""
    messages = [{"role": "user", "content": f"{instruction}\n\n文本：{user_input}"}]
    if output is not None:
        messages.append({"role": "assistant", "content": output})
        return tokenizer.apply_chat_template(messages, tokenize=False)
    return tokenizer.apply_chat_template(
        messages, tokenize=False, add_generation_prompt=True
    )

- 閱讀剩餘部分 -

使用 Qwen2.5B + QLoRA 訓練情緒分類模型：環境檢測與資料集建立

Jkeeper
2026-06-24
LLM
0 則評論

我們將使用 Qwen2.5-1.5B 加上 QLoRA 進行情緒語句的訓練與測試，原本的參數量來説 0.8B 模型就必須 12.8GB vram（全量微調），需要在消費級顯卡上進行測試，那麽就必須將參數量降下來，所以我們將在這裏使用 QLoRA 進行訓練推理，QLoRa 可以將 4bytes 降到 0.5bytes，并且凍結梯度、優化器狀態。

全量微調