回测完整流程图解

返回：流程图解目录 | Wiki 主索引相关文档：回测方法论与实践 | 回测名词解释 | tradehk 信号评分引擎

一、回测总体流程

┌─────────────────────────────────────────────────────────────┐
│                    量化策略回测 7 步流程                       │
└─────────────────────────────────────────────────────────────┘

第一步：数据准备
    ↓
第二步：策略定义与参数设置
    ↓
第三步：数据集分割（训练/验证/测试）
    ↓
第四步：信号生成（严格避免前视偏差）
    ↓
第五步：参数优化（在验证集上）
    ↓
第六步：样本外测试（只执行一次）
    ↓
第七步：结果分析与决策

二、第一步：数据准备流程

数据来源选择：
    ├─ Binance API（推荐，数据质量最高）
    ├─ CoinGecko（备用，部分历史数据）
    └─ 本地数据库（已采集的历史数据）
    │
    ▼
数据质量检查：
    ├─ 检查缺失 K 线（时间戳连续性）
    │   └─ 缺失 > 5%：重新获取或标记为不可用
    ├─ 检查异常值（单根 K 线涨跌幅 > 50%）
    │   └─ 确认是否为真实行情或数据错误
    ├─ 检查成交量（成交量为 0 的 K 线）
    │   └─ 标记为低流动性时段，回测时跳过
    └─ 时区统一（统一转换为 UTC+8 北京时间）
    │
    ▼
数据格式标准化：
    列名：timestamp, open, high, low, close, volume
    时间格式：Unix 时间戳（毫秒）
    价格精度：保留 8 位小数
    存储格式：Parquet（推荐）或 CSV

各品种推荐回测数据量

品种	最少数据量	推荐数据量	原因
BTC	6 个月	2 年	需覆盖牛熊周期
ETH	6 个月	2 年	同 BTC
SOL	3 个月	1 年	历史数据较短
BNB	6 个月	2 年	需覆盖季度销毁
DOGE	3 个月	1 年	高度事件驱动
XAUT	6 个月	2 年	需覆盖多个宏观周期

三、第三步：数据集分割规则

时间顺序分割（不可随机分割！）：

总数据时间范围：T_start → T_end
    │
    ├─ 训练集（70%）：T_start → T_split1
    │   用途：策略开发和初步参数设置
    │
    ├─ 验证集（15%）：T_split1 → T_split2
    │   用途：参数优化和过拟合检测
    │
    └─ 测试集（15%）：T_split2 → T_end
        用途：最终策略评估（只能使用一次！）

示例（2 年数据）：
    训练集：2023-01 至 2024-04（16 个月）
    验证集：2024-04 至 2024-10（6 个月）
    测试集：2024-10 至 2025-03（5 个月）

重要原则：测试集只能在策略完全确定后使用一次。如果在测试集上调整参数，则测试集实际上变成了验证集，需要重新收集新数据作为真正的测试集。

四、第四步：信号生成注意事项

前视偏差检查清单

□ 所有指标计算是否只使用已收线的 K 线数据？
□ EWO 转换信号是否在"已收线确认"后才触发？
□ 入场价格是否使用下一根 K 线的开盘价？
□ ATR 计算是否使用当根 K 线收盘后的数据？
□ 大周期偏向是否使用已完成的 4h K 线？
□ 止损价格是否在入场后才设置（不使用未来数据）？

tradehk 信号系统的正确回测时序

时间 T（K 线收盘）：
    → 计算所有指标（使用 T 及之前的数据）
    → 判断 EWO 是否发生转换
    → 如果触发信号：记录信号，等待下一根 K 线

时间 T+1（下一根 K 线开盘）：
    → 以 T+1 开盘价执行入场
    → 设置止损价格

时间 T+1 至平仓：
    → 每根 K 线检查止损是否触发
    → 每根 K 线检查是否有反向信号（平仓条件）

五、第五步：参数优化流程

网格搜索（适合参数少的情况）

定义参数搜索空间：
    EWO 幅度阈值：[5, 8, 10, 12, 15, 20]
    阶段持续时间阈值：[10, 15, 20, 25, 30]
    信号执行分数阈值：[4, 5, 6, 7]

对每个参数组合：
    → 在验证集上运行回测
    → 计算评估指标（夏普比率、卡尔玛比率）
    → 记录结果

选择最优参数：
    → 优先选择夏普比率 > 1.5 的参数组合
    → 在多个优秀组合中选择参数最稳健的（参数稍变化结果不大变）

过拟合检测

计算样本内外性能比（IS/OOS Ratio）：

IS_Sharpe = 训练集夏普比率
OOS_Sharpe = 验证集夏普比率

IS/OOS Ratio = OOS_Sharpe ÷ IS_Sharpe

判断标准：
    > 0.7：良好，过拟合风险低
    0.5-0.7：一般，谨慎使用
    < 0.5：严重过拟合，需要简化策略

六、第七步：结果分析标准

通过标准（全部满足才考虑实盘）

指标	最低要求	优秀标准
年化收益率	> 20%	> 50%
夏普比率	> 1.0	> 2.0
最大回撤	< 25%	< 15%
卡尔玛比率	> 1.0	> 2.5
胜率	> 45%	> 55%
盈亏比	> 1.2	> 2.0
交易次数	> 100	> 300
IS/OOS 比率	> 0.5	> 0.7

压力测试

在以下极端场景下重新运行回测：

场景一：2025 年 4 月关税战（BTC -30%，3 天内）
    → 策略最大回撤是否可接受？

场景二：2025 年 10 月黑色星期六（$190 亿清算）
    → 策略是否触发连续亏损保护？

场景三：手续费提高 2 倍
    → 策略是否仍然盈利？

场景四：滑点提高 3 倍
    → 策略是否仍然盈利？

全部通过 → 可以考虑模拟盘验证
任一失败 → 需要改进策略后重新回测

七、从回测到实盘的路径

回测通过
    ↓
模拟盘（Paper Trading）验证：至少 1-3 个月
    ├─ 使用真实市场数据
    ├─ 不使用真实资金
    └─ 记录每笔信号和执行情况
    ↓
模拟盘结果评估：
    ├─ 模拟盘夏普比率 ≥ 回测夏普比率 × 0.7？
    ├─ 模拟盘最大回撤 ≤ 回测最大回撤 × 1.5？
    └─ 信号触发频率与回测接近？
    ↓
小资金实盘（账户 10% 资金）：至少 1 个月
    ↓
全资金实盘

7.0 KiB 原始文件 永久链接 Blame 文件历史 Unescape Escape

回测完整流程图解

一、回测总体流程

二、第一步：数据准备流程

各品种推荐回测数据量

三、第三步：数据集分割规则

四、第四步：信号生成注意事项

前视偏差检查清单

tradehk 信号系统的正确回测时序

五、第五步：参数优化流程

网格搜索（适合参数少的情况）

过拟合检测

六、第七步：结果分析标准

通过标准（全部满足才考虑实盘）

压力测试

七、从回测到实盘的路径

八、相关文档

7.0 KiB

原始文件永久链接 Blame 文件历史