Reading Log

模型笔记

这一页是平时读文、跑实验后留下的摘要，主要方便自己回查，不当作系统教程。

这周记下的几个点

Prompt 的稳定性往往比“花哨写法”更重要，结构化输入更稳。
同一个任务下，输出质量和延迟通常需要权衡，不能只盯一个指标。
遇到事实类问题时，接入检索之后可读性和可信度都更好。
日志粒度要够细，不然后续很难复现当时问题。

prompt rag latency observability

近期自测记录

对同一批输入做多次回放，统计输出波动范围。
将失败样本单独放在回归集里，避免问题反复出现。
把“为什么失败”写进备注，而不只记录“失败了”。
每轮调整只改一个变量，减少定位时的噪音。

目前更关注可复现性和稳定性，而不是一次性跑出“惊艳结果”。

准备补充的内容

输入处理

上下文拼接策略对结果的影响
长文本切分与召回命中率
多轮对话的状态管理方式

输出处理

结构化输出校验
异常内容拦截规则
线上回放与人工复核流程