Reading Log

模型笔记

这一页是平时读文、跑实验后留下的摘要,主要方便自己回查,不当作系统教程。

这周记下的几个点

  • Prompt 的稳定性往往比“花哨写法”更重要,结构化输入更稳。
  • 同一个任务下,输出质量和延迟通常需要权衡,不能只盯一个指标。
  • 遇到事实类问题时,接入检索之后可读性和可信度都更好。
  • 日志粒度要够细,不然后续很难复现当时问题。
prompt rag latency observability

近期自测记录

  • 对同一批输入做多次回放,统计输出波动范围。
  • 将失败样本单独放在回归集里,避免问题反复出现。
  • 把“为什么失败”写进备注,而不只记录“失败了”。
  • 每轮调整只改一个变量,减少定位时的噪音。

目前更关注可复现性和稳定性,而不是一次性跑出“惊艳结果”。

准备补充的内容

输入处理

  • 上下文拼接策略对结果的影响
  • 长文本切分与召回命中率
  • 多轮对话的状态管理方式

输出处理

  • 结构化输出校验
  • 异常内容拦截规则
  • 线上回放与人工复核流程