大模型安全探討
成員推斷攻擊(Membership Inference Attack)
目標: 判斷某筆資料是否曾經出現在模型的訓練集中。
攻擊原理&手段
模型對於訓練過的資料會表現出「過度自信」——因為見過這筆資料,所以預測時損失更低、信心度更高。
攻擊者輸入一筆資料 x
↓
查詢模型輸出(機率分佈、損失值、logits)
↓
觀察信心度是否異常高?損失是否異常低?
↓
推斷:x 是否在訓練集中?
urscos Tech.
目標: 判斷某筆資料是否曾經出現在模型的訓練集中。
模型對於訓練過的資料會表現出「過度自信」——因為見過這筆資料,所以預測時損失更低、信心度更高。
攻擊者輸入一筆資料 x
↓
查詢模型輸出(機率分佈、損失值、logits)
↓
觀察信心度是否異常高?損失是否異常低?
↓
推斷:x 是否在訓練集中?
使用 GPT Image2 + Stitch + Claude Code 設計新風格本篇示範一套 AI 輔助 UI 風格設計的完整工作流程,從圖像生成到前端套用,全程透過工具鏈串接完成。
首先在 GPT Image2 中輸入風格描述提示詞,例如「深色星空背景、粒子光點、漸層藍紫色調」,生成一張視覺風格參考圖。

Claude Code 提供多層級的權限控制,避免 AI 誤操作關鍵檔案或執行危險指令。
/config
查看配置
/model
切換模型
/clear
清楚上下文
這篇參考了 llmwiki 的做法,自己實作了一套 LLM + Obsidian 的個人 Wiki 系統,記錄一下整體架構與使用心得。
先定好資料夾分工,讓 AI 知道哪些是原始資料、哪些是它負責維護的知識庫:
my-llm-wiki/
├── raw/ # 原始數據(筆記、文章、資料來源)
├── wiki/ # AI 維護的知識庫文本
├── outputs/ # AI 生成的成品
└── CLAUDE.md # 系統規則文件
三個資料夾職責清楚分開,避免 AI 處理時混淆來源與產出。
這次測試了三種不同的方式來自動生成 Unity UGUI Prefab,分別是透過 PSD Parser、元件+腳本,以及直接從 Figma 導出。以下記錄各方式的實驗結果。
透過解析 PSD 圖層結構,自動對應生成 UGUI 元件。挑選了兩組效果比較好的 PSD 進行測試。