质量评估标准
编辑节点质量(每项1-5分,共20分)
1. 画面感增强(1-5分)
- 5分:显著增强,添加了丰富的视觉细节(光影、色彩、空间感)
- 4分:明显增强,有较多视觉描述
- 3分:适度增强,有一些视觉细节
- 2分:略有增强,视觉描述不明显
- 1分:几乎无增强,缺乏画面感
2. 情感表达(1-5分)
- 5分:情感细腻,氛围渲染到位,读者能深刻感受
- 4分:情感表达清晰,有一定的氛围渲染
- 3分:情感表达基本到位
- 2分:情感表达较弱
- 1分:缺乏情感色彩
3. 文本流畅性(1-5分)
- 5分:行文流畅,节奏把控好,语言精炼
- 4分:较流畅,节奏比较自然
- 3分:基本流畅,偶有生硬处
- 2分:不够流畅,有多处生硬
- 1分:流畅性差
4. 长度控制(1-5分)
- 5分:长度控制在原文本的1.2-1.5倍,恰到好处
- 4分:长度接近理想范围(1.1-1.6倍)
- 3分:长度略有偏差(1.0-1.7倍)
- 2分:长度偏差较大
- 1分:过长或过短
分镜节点质量(每项1-5分,共20分)
1. 分镜数量(1-5分)
- 5分:3-5个分镜,数量适中,节奏合理
- 4分:分镜数量接近理想(2-6个)
- 3分:分镜数量略有偏差
- 2分:分镜数量不合理(过少或过多)
- 1分:分镜数量严重偏离要求
2. 描述具体性(1-5分)
- 5分:场景描述非常具体,包含完整的视觉元素
- 4分:场景描述较具体,大部分视觉元素清晰
- 3分:场景描述基本清晰
- 2分:场景描述不够具体
- 1分:场景描述模糊,无法视觉化
3. 提示词质量(1-5分)
- 5分:提示词详细完整,包含构图、灯光、风格等要素,可直接用于图片生成
- 4分:提示词较详细,包含多个要素
- 3分:提示词基本可用,缺少部分要素
- 2分:提示词不够详细,难以直接使用
- 1分:提示词质量差,无法使用
4. 格式规范性(1-5分)
- 5分:严格遵循Markdown格式,结构清晰完整
- 4分:格式较规范,有轻微偏差
- 3分:格式基本正确
- 2分:格式有多处错误
- 1分:格式混乱
总体评分标准
总分(满分40分):
- 优秀(36-40分):输出质量高,可直接用于图片生成
- 良好(28-35分):输出质量不错,稍作调整即可使用
- 一般(20-27分):输出质量一般,需要较多调整
- 需要改进(<20分):输出质量不足,需要优化提示词
评估记录表格
测试用例1评分表
| 评估项目 |
得分 |
备注 |
| 编辑节点(/20) |
|
|
| 画面感增强 |
/5 |
|
| 情感表达 |
/5 |
|
| 文本流畅性 |
/5 |
|
| 长度控制 |
/5 |
|
| 分镜节点(/20) |
|
|
| 分镜数量 |
/5 |
|
| 描述具体性 |
/5 |
|
| 提示词质量 |
/5 |
|
| 格式规范性 |
/5 |
|
| 总分 |
/40 |
|
测试用例2评分表
| 评估项目 |
得分 |
备注 |
| 编辑节点(/20) |
|
|
| 画面感增强 |
/5 |
|
| 情感表达 |
/5 |
|
| 文本流畅性 |
/5 |
|
| 长度控制 |
/5 |
|
| 分镜节点(/20) |
|
|
| 分镜数量 |
/5 |
|
| 描述具体性 |
/5 |
|
| 提示词质量 |
/5 |
|
| 格式规范性 |
/5 |
|
| 总分 |
/40 |
|
测试用例3评分表
| 评估项目 |
得分 |
备注 |
| 编辑节点(/20) |
|
|
| 画面感增强 |
/5 |
|
| 情感表达 |
/5 |
|
| 文本流畅性 |
/5 |
|
| 长度控制 |
/5 |
|
| 分镜节点(/20) |
|
|
| 分镜数量 |
/5 |
|
| 描述具体性 |
/5 |
|
| 提示词质量 |
/5 |
|
| 格式规范性 |
/5 |
|
| 总分 |
/40 |
|
测试用例4评分表
| 评估项目 |
得分 |
备注 |
| 编辑节点(/20) |
|
|
| 画面感增强 |
/5 |
|
| 情感表达 |
/5 |
|
| 文本流畅性 |
/5 |
|
| 长度控制 |
/5 |
|
| 分镜节点(/20) |
|
|
| 分镜数量 |
/5 |
|
| 描述具体性 |
/5 |
|
| 提示词质量 |
/5 |
|
| 格式规范性 |
/5 |
|
| 总分 |
/40 |
|
综合评估总结
平均得分:____ / 40
总体评级:
主要优点:
主要问题:
改进建议:
可行性判断: