Komga Creater
小说文本到漫画分镜提示词的工作流项目。
这个仓库既可作为对外展示的项目说明,也可直接作为团队内部的实施手册使用。
项目简介
Komga Creater 基于 Dify + DeepSeek,将小说段落转换为结构化漫画分镜(Markdown),用于后续图片生成。
核心价值:
- 快速验证从文本到分镜提示词的可行性
- 降低分镜设计门槛,提升创作效率
- 提供标准化测试用例与质量评估体系
适用场景
- 小说可视化与漫画改编前期
- AIGC 分镜提示词批量生产
- 团队内部提示词工程验证
功能概览
- 单路径验证版工作流:编辑 -> 分镜
- 双模式工作流:
- 传统漫画分镜(静态叙事)
- 时间线漫画分镜(连续动作)
- 配套文档:导入、配置、手动搭建、测试与评分
仓库结构
.
├── workflow/
│ ├── manga-generator-dify-dsl.json # 早期 JSON DSL(参考)
│ ├── 漫画生成验证工作流.yml # 单路径验证版(MVP)
│ └── 漫画生成工作流-v2.yml # 双模式增强版
├── docs/
│ ├── dify-import-guide.md # DSL 导入指南
│ ├── dify-setup-guide.md # Dify + DeepSeek 配置说明
│ ├── dify-manual-setup-guide.md # 手动搭建步骤
│ └── workflow-v2-readme.md # v2 详细说明
├── tests/
│ ├── test-inputs.md # 测试输入样例
│ └── quality-assessment.md # 质量评分标准
└── .env.template # 环境变量模板
快速开始(外部用户)
- 登录 Dify:
https://dify.wutongshucloud.com - 创建应用并导入 DSL:
workflow/漫画生成验证工作流.yml(快速验证)workflow/漫画生成工作流-v2.yml(推荐)
- 在 Dify 中配置 DeepSeek 模型
- 运行测试输入,查看分镜输出
详细导入说明见:docs/dify-import-guide.md
实施手册(内部团队)
1. 环境准备
cp .env.template .env
填写以下变量:
DIFY_API_KEYDIFY_BASE_URLDEEPSEEK_API_KEYWORKFLOW_NAMEMODEL_NAME
2. 工作流选择建议
- 需求是“先打通流程”:使用
漫画生成验证工作流.yml - 需求是“覆盖更多输入类型”:使用
漫画生成工作流-v2.yml
3. 测试执行
- 使用测试集:
tests/test-inputs.md - 按评分标准评估:
tests/quality-assessment.md - 记录每个用例总分与主要问题
4. 验收标准
- 流程完整跑通(输入 -> 编辑 -> 分镜 -> 输出)
- 输出结构符合 Markdown 规范
- 分镜描述可视化明确,提示词可直接用于图片生成
- 综合评分达到团队设定阈值(建议 >= 28/40)
常用文档入口
- 配置指南:docs/dify-setup-guide.md
- 导入指南:docs/dify-import-guide.md
- 手动搭建:docs/dify-manual-setup-guide.md
- v2 说明:docs/workflow-v2-readme.md
路线建议
- 先用验证版确认质量下限
- 切换到 v2 处理复杂动作场景
- 通过测试评分持续迭代提示词
- 验证稳定后再接入图片生成 API 与服务化部署
备注
本仓库当前聚焦“工作流验证与提示词工程”,不包含完整前后端应用代码。
Description
Languages
Markdown
100%