2.9 KiB
2.9 KiB
Source Digest: 2026-03-04 AI Pipeline Reliability
Purpose
提炼 20260304-AI自动化开发流水线与可靠性工程(1).md 中关于可靠性工程、偏差放大、Gap 对齐、代码简化和阶段性重构的规则。
When to Use
- 需要定义为什么不能让模型从需求直接写代码时
- 需要设计
Alignment、Refinement和质量检查点时 - 需要解释 80% 单步可靠性为何会导致整体失控时
Inputs
20260304-AI自动化开发流水线与可靠性工程(1).md
Outputs
- 可靠性收敛规则
- Gap 分类与质量机制
- 与其他来源的冲突说明
Primary Agent/Model
GPT-5.4 Pro xhigh
Secondary Agent/Model
Claude Opus 4.6
Required Skills
spec-gap-taskingcode-simplifyingcode-refactoringarchitecture-audit
Steps
- 提炼可靠性数学和偏差来源。
- 提炼“遗漏”和“过度添加”两类核心失真。
- 映射到 Alignment、Refinement 和 Acceptance 页。
- 把策略性选项与执行规则分开。
Exit Criteria
- 可靠性收敛逻辑已经转化为阶段化执行规则
- 缺口分类、检查点、验收路径全部有落点
Failure Recovery
- 若与更具体的技能规则冲突,以技能规则定义的任务结构和检查点为准
Related Templates
Core Conclusions
- 从需求到代码的每一层都会放大偏差,不能把“总体看起来差不多”当作可靠。
- 减少层级和提升单步质量,是提高整体可靠性的两个杠杆。
- AI 实施最主要的两类问题是
遗漏和过度添加,分别需要Gap 对齐和代码简化去收敛。 - 简化、重构、对齐不能作为末尾补丁,而要嵌入主流程。
Spec的质量决定最终收敛上限,低质量 Spec 只会让系统更快地收敛到低质量结果。
Reusable Rules
- 用
Alignment补齐Missing / Partial / Divergent / Untested / Integration五类缺口。 - 每 4 个类别插入一次质量检查点,防止技术债堆积。
Refinement不是一次“美化”,而是全库级的清晰度、结构和架构收敛。Acceptance必须由人主导,不能被自动化审查替代。
Background Only
- 各组用量对比
- 外部项目 OpenClaw 的星数与账号投入
- 市场竞争与六月产品上线时间点
Conflict Notes
- 本文对 95% 单步可靠性给出目标值,但没有提供模板和目录组织;执行骨架依旧以
workflow.zip和skills.zip为准。 - 文中部分质量检查点是理念层描述,正式任务对的生成方式以
spec-gap-tasking为准。
Traceability Targets
foundations/reliability-and-convergence.mdfoundations/refactoring-and-gap-closure.mdworkflows/stage-4-alignment.mdworkflows/stage-5-refinement.mdworkflows/stage-6-acceptance.md