將之前做的產圖寫一份報告

整個 pipeline 拆成三層:

  • 訓練端(kohya_ss + 自製多姿勢 base img2img)
  • 出圖端(ComfyUI A+B+F workflow:LoRA → Hi-Res Fix → FaceDetailer)
  • 操作端(Streamlit 角色管線)。

資料源是單一 YAML,從外觀 prompt、表情、CG 階段、LoRA,檔名全部寫在一處,下游全靠 loader 拼裝。

- 閱讀剩餘部分 -

今天在 x 上面發現個好玩的 AI 應用

給了一張原圖

94604-fkf7vdxmnu7.png

點圖片上的位置點,可以即時生成對應的縮略解説圖,這個用在景區的概要説明可真是好玩的不行

77990-2wknkk4ro3c.png

60145-z6ug0qui0j.png

網址參考如下

https://flipbook.page/

估計使用了 LLM 進行圖片解析再利用訓練過的模型生成圖片,看起來風格是一致的,只是應用價值跟落地有明確的關聯性,但這真的不錯。