komga-creater/tests/quality-assessment.md
2026-03-03 17:59:27 +08:00

4.8 KiB
Raw Blame History

质量评估标准

编辑节点质量每项1-5分共20分

1. 画面感增强1-5分

  • 5分:显著增强,添加了丰富的视觉细节(光影、色彩、空间感)
  • 4分:明显增强,有较多视觉描述
  • 3分:适度增强,有一些视觉细节
  • 2分:略有增强,视觉描述不明显
  • 1分:几乎无增强,缺乏画面感

2. 情感表达1-5分

  • 5分:情感细腻,氛围渲染到位,读者能深刻感受
  • 4分:情感表达清晰,有一定的氛围渲染
  • 3分:情感表达基本到位
  • 2分:情感表达较弱
  • 1分:缺乏情感色彩

3. 文本流畅性1-5分

  • 5分:行文流畅,节奏把控好,语言精炼
  • 4分:较流畅,节奏比较自然
  • 3分:基本流畅,偶有生硬处
  • 2分:不够流畅,有多处生硬
  • 1分:流畅性差

4. 长度控制1-5分

  • 5分长度控制在原文本的1.2-1.5倍,恰到好处
  • 4分长度接近理想范围1.1-1.6倍)
  • 3分长度略有偏差1.0-1.7倍)
  • 2分:长度偏差较大
  • 1分:过长或过短

分镜节点质量每项1-5分共20分

1. 分镜数量1-5分

  • 5分3-5个分镜数量适中节奏合理
  • 4分分镜数量接近理想2-6个
  • 3分:分镜数量略有偏差
  • 2分:分镜数量不合理(过少或过多)
  • 1分:分镜数量严重偏离要求

2. 描述具体性1-5分

  • 5分:场景描述非常具体,包含完整的视觉元素
  • 4分:场景描述较具体,大部分视觉元素清晰
  • 3分:场景描述基本清晰
  • 2分:场景描述不够具体
  • 1分:场景描述模糊,无法视觉化

3. 提示词质量1-5分

  • 5分:提示词详细完整,包含构图、灯光、风格等要素,可直接用于图片生成
  • 4分:提示词较详细,包含多个要素
  • 3分:提示词基本可用,缺少部分要素
  • 2分:提示词不够详细,难以直接使用
  • 1分:提示词质量差,无法使用

4. 格式规范性1-5分

  • 5分严格遵循Markdown格式结构清晰完整
  • 4分:格式较规范,有轻微偏差
  • 3分:格式基本正确
  • 2分:格式有多处错误
  • 1分:格式混乱

总体评分标准

总分满分40分

  • 优秀36-40分:输出质量高,可直接用于图片生成
  • 良好28-35分:输出质量不错,稍作调整即可使用
  • 一般20-27分:输出质量一般,需要较多调整
  • 需要改进(<20分:输出质量不足,需要优化提示词

评估记录表格

测试用例1评分表

评估项目 得分 备注
编辑节点(/20
画面感增强 /5
情感表达 /5
文本流畅性 /5
长度控制 /5
分镜节点(/20
分镜数量 /5
描述具体性 /5
提示词质量 /5
格式规范性 /5
总分 /40

测试用例2评分表

评估项目 得分 备注
编辑节点(/20
画面感增强 /5
情感表达 /5
文本流畅性 /5
长度控制 /5
分镜节点(/20
分镜数量 /5
描述具体性 /5
提示词质量 /5
格式规范性 /5
总分 /40

测试用例3评分表

评估项目 得分 备注
编辑节点(/20
画面感增强 /5
情感表达 /5
文本流畅性 /5
长度控制 /5
分镜节点(/20
分镜数量 /5
描述具体性 /5
提示词质量 /5
格式规范性 /5
总分 /40

测试用例4评分表

评估项目 得分 备注
编辑节点(/20
画面感增强 /5
情感表达 /5
文本流畅性 /5
长度控制 /5
分镜节点(/20
分镜数量 /5
描述具体性 /5
提示词质量 /5
格式规范性 /5
总分 /40

综合评估总结

平均得分____ / 40

总体评级:

  • 优秀36-40分
  • 良好28-35分
  • 一般20-27分
  • 需要改进(<20分

主要优点:

主要问题:

改进建议:

可行性判断:

  • 可行:输出质量达标,流程顺畅,可以继续优化
  • 部分可行:需要调整提示词或参数后再次测试
  • 不可行:输出质量不足,需要重新设计方案