自一致性
自一致性方法通过多次采样生成多个推理路径,然后通过投票或聚合选择最一致的答案。这种方法利用了「正确答案更容易被多次独立推导出」的原理,显著提升推理任务的准确性。
高级 推理增强
适用场景
推理任务需要高准确性时;单次 CoT 结果不够可靠时;有足够的计算预算时;需要置信度评估时。
Prompt 示例
请用 3 种不同的方法解决以下问题,然后选择出现最多的答案: 问题:一个班有 40 人,男生比女生多 8 人,男生有多少人? 方法 1(代数法):设女生 x 人... 方法 2(算术法):总人数减去差... 方法 3(验证法):假设一个答案验证...
输出示例
方法 1(代数法): 设女生 x 人,男生 x+8 人 x + (x+8) = 40 → 2x = 32 → x = 16 男生 = 24 人 方法 2(算术法): (40 + 8) / 2 = 24 男生 = 24 人 方法 3(验证法): 假设男生 24 人,女生 16 人 24 + 16 = 40,24 - 16 = 8 男生 = 24 人 三种方法一致:男生有 24 人。置信度:高。
最佳实践
- 采样次数通常 3-5 次即可
- 使用较高温度(0.7-0.9)增加多样性
- 对于选择题,直接统计答案频率
- 可以要求模型自己执行多路径推理
常见坑
- 计算成本是单次调用的 N 倍
- 如果问题本身有歧义,投票可能无法收敛
- 所有路径都错误时投票也无法纠正