Token 限制#
本文档介绍 UI 中"每次调用类型的 Token 限制"控制项及对应的后端设置。
这些限制不会改变模型的总上下文窗口大小。它们控制的是特定阶段中单次模型调用的最大输出长度。
实际效果:
提高某个限制,可让该阶段有更多空间来完成证明、定理语句或草稿。
降低某个限制,可使该阶段更省钱、更快,但增加被截断的风险。
最有调优价值的限制取决于您使用的是哪个理论流水线。
设置位置#
后端配置位于:
eurekaclaw/config.py
UI 配置映射位于:
eurekaclaw/ui/server.py(_CONFIG_FIELDS)
UI 表单位于:
frontend/index.htmleurekaclaw/ui/static/index.html
速查表#
变量 |
默认值 |
使用者 |
|---|---|---|
|
|
通用智能体循环(SurveyAgent、WriterAgent、回退路径) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
上下文压缩摘要(快速模型) |
各流水线使用情况#
理论流水线有两种:
defaultmemory_guided
default 流水线#
对 default 流水线影响最大的阶段:
ArchitectProverAssemblerTheoremCrystallizerVerifier
相关代码:
若 default 流水线遇到问题,通常最有效的调节顺序为:
ArchitectProverAssemblerTheoremCrystallizerVerifier
memory_guided 流水线#
对 memory_guided 流水线影响最大的阶段:
AnalystDecomposerProverAssemblerTheoremCrystallizerVerifier
相关代码:
若 memory_guided 流水线遇到问题,通常最有效的调节顺序为:
AnalystDecomposerProverAssemblerTheoremCrystallizerVerifier
各重要阶段的作用#
智能体循环#
用于通用智能体调用,包括:
SurveyAgentWriterAgent所有回退到通用基础智能体路径的阶段
相关代码:
在以下情况时提高:
调研结果过短
Writer 频繁提前停止
Prover#
用于引理级别的定理证明生成。
相关代码:
在以下情况时提高:
引理证明在论证中途停止
Prover 频繁省略技术步骤
Architect#
用于 default 流水线中的 ProofArchitect。
相关代码:
在以下情况时提高:
证明计划过于浅层
Architect 返回不完整的引理结构
Analyst#
用于 memory_guided 流水线中的 MemoryGuidedAnalyzer、TemplateSelector 和 ProofSkeletonBuilder。
相关代码:
在以下情况时提高:
流水线选择了较差的证明模板
证明框架过于粗略
记忆引导分析内容过薄
Decomposer#
用于分解式阶段,包括 KeyLemmaExtractor。
相关代码:
在以下情况时提高:
关键引理缺失
分解粒度过粗
Assembler#
用于生成 state.assembled_proof。
相关代码:
在以下情况时提高:
证明正文在句子中途结束
assembled_proof看起来被截断后续定理提取失败,因为证明叙述不完整
TheoremCrystallizer#
用于生成 state.formal_statement。
相关代码:
在以下情况时提高:
定理语句被截断
定理在公式中途结束
定理块中缺少汇总证明中存在的假设或术语
Verifier#
用于:
引理同行评审
一致性检查
相关代码:
在以下情况时提高:
审阅者输出过于简短
一致性检查遗漏了明显问题
Formalizer / Refiner#
多个定理支撑阶段的共享预算:
FormalizerRefinerCounterexampleSearcherResourceAnalystPaperReader
相关代码:
在以下情况时提高:
论文提取内容过浅
反例搜索结果过少
改进建议不完整
实践指南#
若汇总证明被截断#
依次提高:
Assembler若引理证明也过短,提高
Prover
若定理语句被截断#
依次提高:
TheoremCrystallizer若证明叙述本身不完整,提高
Assembler
若 default 规划效果较弱#
依次提高:
ArchitectProver
若 memory_guided 规划效果较弱#
依次提高:
AnalystDecomposerProver
若 Writer 或 Survey 输出过短#
提高:
Agent loop
重要区别#
这些控制项不等同于模型的完整上下文窗口。
它们仅控制:
单个阶段在一次调用中最多输出多少内容
它们不直接控制:
可发送的总对话历史量
模型完整上下文窗口的大小
因此,一个阶段可能以两种不同方式失败:
该阶段自身的 token 限制过低,导致输出过短
整个请求过于繁重或复杂,即使单次调用限制足够大也会失败
当前 UI 覆盖范围#
UI 现已暴露两个理论流水线使用的主要 token 限制控制项,包括:
ArchitectAssemblerTheoremCrystallizerAnalystSketch
若后续在后端添加了新的 max_tokens_* 字段,请记得同步更新: