komga-creater/tests/quality-assessment.md
2026-03-03 17:59:27 +08:00

174 lines
4.8 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

## 质量评估标准
### 编辑节点质量每项1-5分共20分
#### 1. 画面感增强1-5分
- **5分**:显著增强,添加了丰富的视觉细节(光影、色彩、空间感)
- **4分**:明显增强,有较多视觉描述
- **3分**:适度增强,有一些视觉细节
- **2分**:略有增强,视觉描述不明显
- **1分**:几乎无增强,缺乏画面感
#### 2. 情感表达1-5分
- **5分**:情感细腻,氛围渲染到位,读者能深刻感受
- **4分**:情感表达清晰,有一定的氛围渲染
- **3分**:情感表达基本到位
- **2分**:情感表达较弱
- **1分**:缺乏情感色彩
#### 3. 文本流畅性1-5分
- **5分**:行文流畅,节奏把控好,语言精炼
- **4分**:较流畅,节奏比较自然
- **3分**:基本流畅,偶有生硬处
- **2分**:不够流畅,有多处生硬
- **1分**:流畅性差
#### 4. 长度控制1-5分
- **5分**长度控制在原文本的1.2-1.5倍,恰到好处
- **4分**长度接近理想范围1.1-1.6倍)
- **3分**长度略有偏差1.0-1.7倍)
- **2分**:长度偏差较大
- **1分**:过长或过短
---
### 分镜节点质量每项1-5分共20分
#### 1. 分镜数量1-5分
- **5分**3-5个分镜数量适中节奏合理
- **4分**分镜数量接近理想2-6个
- **3分**:分镜数量略有偏差
- **2分**:分镜数量不合理(过少或过多)
- **1分**:分镜数量严重偏离要求
#### 2. 描述具体性1-5分
- **5分**:场景描述非常具体,包含完整的视觉元素
- **4分**:场景描述较具体,大部分视觉元素清晰
- **3分**:场景描述基本清晰
- **2分**:场景描述不够具体
- **1分**:场景描述模糊,无法视觉化
#### 3. 提示词质量1-5分
- **5分**:提示词详细完整,包含构图、灯光、风格等要素,可直接用于图片生成
- **4分**:提示词较详细,包含多个要素
- **3分**:提示词基本可用,缺少部分要素
- **2分**:提示词不够详细,难以直接使用
- **1分**:提示词质量差,无法使用
#### 4. 格式规范性1-5分
- **5分**严格遵循Markdown格式结构清晰完整
- **4分**:格式较规范,有轻微偏差
- **3分**:格式基本正确
- **2分**:格式有多处错误
- **1分**:格式混乱
---
### 总体评分标准
**总分满分40分**
- **优秀36-40分**:输出质量高,可直接用于图片生成
- **良好28-35分**:输出质量不错,稍作调整即可使用
- **一般20-27分**:输出质量一般,需要较多调整
- **需要改进(<20分**输出质量不足需要优化提示词
---
### 评估记录表格
#### 测试用例1评分表
| 评估项目 | 得分 | 备注 |
|---------|-----|------|
| **编辑节点(/20** | | |
| 画面感增强 | /5 | |
| 情感表达 | /5 | |
| 文本流畅性 | /5 | |
| 长度控制 | /5 | |
| **分镜节点(/20** | | |
| 分镜数量 | /5 | |
| 描述具体性 | /5 | |
| 提示词质量 | /5 | |
| 格式规范性 | /5 | |
| **总分** | **/40** | |
#### 测试用例2评分表
| 评估项目 | 得分 | 备注 |
|---------|-----|------|
| **编辑节点(/20** | | |
| 画面感增强 | /5 | |
| 情感表达 | /5 | |
| 文本流畅性 | /5 | |
| 长度控制 | /5 | |
| **分镜节点(/20** | | |
| 分镜数量 | /5 | |
| 描述具体性 | /5 | |
| 提示词质量 | /5 | |
| 格式规范性 | /5 | |
| **总分** | **/40** | |
#### 测试用例3评分表
| 评估项目 | 得分 | 备注 |
|---------|-----|------|
| **编辑节点(/20** | | |
| 画面感增强 | /5 | |
| 情感表达 | /5 | |
| 文本流畅性 | /5 | |
| 长度控制 | /5 | |
| **分镜节点(/20** | | |
| 分镜数量 | /5 | |
| 描述具体性 | /5 | |
| 提示词质量 | /5 | |
| 格式规范性 | /5 | |
| **总分** | **/40** | |
#### 测试用例4评分表
| 评估项目 | 得分 | 备注 |
|---------|-----|------|
| **编辑节点(/20** | | |
| 画面感增强 | /5 | |
| 情感表达 | /5 | |
| 文本流畅性 | /5 | |
| 长度控制 | /5 | |
| **分镜节点(/20** | | |
| 分镜数量 | /5 | |
| 描述具体性 | /5 | |
| 提示词质量 | /5 | |
| 格式规范性 | /5 | |
| **总分** | **/40** | |
---
### 综合评估总结
#### 平均得分____ / 40
#### 总体评级:
- [ ] 优秀36-40分
- [ ] 良好28-35分
- [ ] 一般20-27分
- [ ] 需要改进<20分
#### 主要优点:
1.
2.
3.
#### 主要问题:
1.
2.
3.
#### 改进建议:
1.
2.
3.
#### 可行性判断:
- [ ] **可行**输出质量达标流程顺畅可以继续优化
- [ ] **部分可行**需要调整提示词或参数后再次测试
- [ ] **不可行**输出质量不足需要重新设计方案