feat: 全面优化迭代所有文档 - 增加数据说明+计算公式+名词解释+内部链接
变更统计: - 70个文件变更 (39个新增 + 31个修改) - 新增 6554 行内容 优化内容: 1. 30个核心文档增加附录(数据说明/计算公式/参数表/使用场景/常见误区) - 第一批: 量化基础/技术指标/策略/信号/品种/数据流/回测/风控/链上/EWO - 第二批: AI/案例复盘/多Agent/Hyperliquid/KOL/期权/RWA/券商/BTC/主流币 - 第三批: ETH/SOL/BNB_DOGE/XAUT/代币化美股/信号优化/tradehk系统 2. 新增38个名词解释wiki条目(Delta对冲/Gamma/Theta/Vega/IV/VaR/CVaR等) 3. 更新全局术语表索引(79个术语/12大类/知识图谱/学习路径) 4. 新增内部链接体系(wiki式交叉引用)
这个提交包含在:
@@ -127,3 +127,112 @@ LLM(大语言模型)开始处理非结构化数据(新闻、社交媒体
|
||||
[^1]: Whaleportal. "Quantitative Crypto Trading: Strategies, Automation & Backtesting". https://whaleportal.com/blog/quantitative-crypto-trading-strategies-automation-backtesting/
|
||||
|
||||
[^2]: Cao, B. et al. "From Deep Learning to LLMs: A survey of AI in Quantitative Investment". arXiv:2503.21422, 2025. https://arxiv.org/abs/2503.21422
|
||||
|
||||
---
|
||||
|
||||
## 附录:数据说明与补充
|
||||
|
||||
本附录旨在对文档中提及的核心概念提供更详尽的数据说明、使用场景、参数参考及格式规范,以帮助量化交易从业者在实践中更精确地应用这些知识。
|
||||
|
||||
### 一、核心指标数据说明
|
||||
|
||||
为了确保量化策略的准确性和可复现性,对关键指标的计算和数据属性有清晰的定义至关重要。下表整理了部分核心指标的详细说明。
|
||||
|
||||
| 指标名称 | 计算公式 (LaTeX) | 数据范围 | 单位 | 精度建议 | 主要数据来源 |
|
||||
| :--- | :--- | :--- | :--- | :--- | :--- |
|
||||
| **[夏普比率](../../wiki/名词解释/夏普比率.md)** | `\frac{E[R_p] - R_f}{\sigma_p}` | 通常为 -5 到 +5 | 无量纲 | 4 位小数 | 策略收益率序列、无风险利率 |
|
||||
| **[最大回撤](../../wiki/名词解释/最大回撤.md)** | `\max_{t} \frac{P_t - V_t}{P_t}` | (0, 1] | 百分比 (%) | 2 位小数 | 策略净值曲线 |
|
||||
| **买卖价差** | `P_{ask} - P_{bid}` | > 0 | 计价货币 | 交易所最小价格精度 | 交易所订单簿数据 |
|
||||
| **[资金费率](../../wiki/名词解释/资金费率.md)** | `(溢价指数 - 利率) / 结算周期` | 通常为 -0.5% 到 +0.5% | 百分比 (%) | 8 位小数 | 交易所永续合约市场 |
|
||||
| **波动率** | `\sqrt{\frac{1}{N-1} \sum_{i=1}^{N} (R_i - \bar{R})^2}` | > 0 | 百分比 (%) | 4 位小数 | 历史价格序列 |
|
||||
|
||||
*注:公式中,$E[R_p]$ 为策略期望收益率,$R_f$ 为无风险利率,$\sigma_p$ 为策略收益率的标准差。$P_t$ 为时间 $t$ 的峰值净值,$V_t$ 为时间 $t$ 的谷底净值。*
|
||||
|
||||
### 二、核心概念应用场景
|
||||
|
||||
理论概念的价值在于其实际应用。以下为几个核心概念在真实量化交易中的应用场景。
|
||||
|
||||
**1. 市场深度 (Market Depth)**
|
||||
|
||||
* **冲击成本预估**:在执行大额订单前,策略需要分析订单簿的深度,预估自身交易行为对市场价格的冲击。如果目标成交量的累计深度超过某个阈值,策略可能会选择拆分订单或使用 TWAP(时间加权平均价格)等算法来减小冲击成本。
|
||||
* **流动性提供策略**:做市策略通过分析市场深度来决定在何处放置限价单。在深度较差的区域挂单,虽然成交概率较低,但可能获得更高的价差收益;在深度集中的区域挂单,成交更快但利润更薄。
|
||||
|
||||
**2. 资金费率 (Funding Rate)**
|
||||
|
||||
* **期现套利**:当永续合约的资金费率为正且显著高于借贷成本时,交易者可以买入现货并做空等价值的永续合约,赚取资金费率作为无风险收益。反之,当资金费率为负时,则可反向操作。
|
||||
* **市场情绪指标**:长期的正资金费率通常表明市场看涨情绪浓厚,多头杠杆较高;反之则表明看跌情绪占主导。一些趋势策略或反转策略会将资金费率作为一个重要的情绪指标来辅助决策。
|
||||
|
||||
**3. 链上数据 (On-chain Data)**
|
||||
|
||||
* **巨鲸动向追踪**:通过监控链上大额转账,特别是交易所的流入流出地址,可以判断主力资金的动向。例如,大量稳定币流入交易所可能预示着潜在的买盘,而大量比特币从交易所提现至冷钱包则可能被解读为长期持有信号。
|
||||
* **DeFi 协议分析**:针对去中心化交易所(DEX),可以分析其流动性池的组成、交易量变化、以及 LP(流动性提供者)的增减情况,用于发现新的交易机会或评估特定资产的风险。
|
||||
|
||||
### 三、常见策略参数参考表
|
||||
|
||||
任何量化策略都包含一系列可配置参数,其取值直接影响策略表现。下表以一个典型的双均线交叉策略为例,提供参数参考。
|
||||
|
||||
| 参数名称 | 描述 | 推荐值 | 取值范围 | 备注 |
|
||||
| :--- | :--- | :--- | :--- | :--- |
|
||||
| `short_window` | 短周期均线的时间窗口 | 10 | 5 - 30 | 周期越短,对价格变化越敏感 |
|
||||
| `long_window` | 长周期均线的时间窗口 | 30 | 20 - 90 | 必须大于 `short_window` |
|
||||
| `stop_loss_pct` | 止损百分比 | 0.05 | 0.01 - 0.10 | 即 5%,根据资产波动率调整 |
|
||||
| `take_profit_pct`| 止盈百分比 | 0.10 | 0.05 - 0.20 | 即 10%,可设置为止损的 2-3 倍 |
|
||||
| `trade_amount` | 单笔交易金额 | 1000 | > 0 | 以计价货币(如 USDT)为单位 |
|
||||
|
||||
### 四、标准数据格式规范
|
||||
|
||||
标准化的数据格式是保证多策略、多模块协同工作的基础。以下是两种核心数据类型的推荐 JSON 格式。
|
||||
|
||||
**1. K线 (OHLCV) 数据**
|
||||
|
||||
K线数据是时间序列分析的基础,通常以数组形式提供,每个元素代表一个时间周期。
|
||||
|
||||
```json
|
||||
[
|
||||
{
|
||||
"timestamp": 1672531200000, // Unix 毫秒时间戳
|
||||
"open": 16500.00,
|
||||
"high": 16550.50,
|
||||
"low": 16480.25,
|
||||
"close": 16525.75,
|
||||
"volume": 120.5 // 交易量,单位为基础货币 (如 BTC)
|
||||
},
|
||||
// ... more k-line data
|
||||
]
|
||||
```
|
||||
|
||||
**2. 订单簿快照 (Order Book Snapshot)**
|
||||
|
||||
订单簿数据反映了市场的即时流动性结构。
|
||||
|
||||
```json
|
||||
{
|
||||
"symbol": "BTC/USDT",
|
||||
"timestamp": 1672531260500, // 快照生成时的 Unix 毫秒时间戳
|
||||
"bids": [
|
||||
[29999.5, 0.5], // [价格, 数量]
|
||||
[29999.0, 1.2]
|
||||
],
|
||||
"asks": [
|
||||
[30000.5, 0.8],
|
||||
[30001.0, 2.1]
|
||||
]
|
||||
}
|
||||
```
|
||||
|
||||
### 五、常见误区与正确理解
|
||||
|
||||
1. **误区:回测收益率越高,策略越好。**
|
||||
* **正确理解**:高回测收益率很可能是[过拟合](../../wiki/名词解释/过拟合.md)的结果。评估策略的核心是其在样本外数据(实盘)的表现、夏普比率、以及最大回撤。一个稳健的策略,其收益曲线应该平滑,而不是充满尖峰。
|
||||
|
||||
2. **误区:量化交易就是预测价格涨跌。**
|
||||
* **正确理解**:量化交易的核心是寻找并利用统计优势,而非完美预测。许多成功的策略(如套利、做市)并不预测价格方向,而是从市场微观结构的无效性中获利。
|
||||
|
||||
3. **误区:忽略交易成本和滑点。**
|
||||
* **正确理解**:在高频或中高频策略中,交易成本是决定策略盈利与否的关键。回测时必须引入合理的交易手续费和滑点模型,否则回测结果将与实盘产生巨大偏差。
|
||||
|
||||
4. **误区:发现 Alpha 后可以一劳永逸。**
|
||||
* **正确理解**:Alpha 是会衰减的。随着一个有效的策略被越来越多人发现和使用,其超额收益会逐渐消失。成功的量化团队需要不断进行研究,开发新的 [Alpha](../../wiki/名词解释/Alpha.md) 来源。
|
||||
|
||||
5. **误区:数据越多越好,不需要清洗。**
|
||||
* **正确理解**:数据的质量远比数量重要。加密货币市场充斥着刷量、异常价格(毛刺)等“脏数据”。在使用数据前,必须进行严格的清洗、插值和验证,否则模型将基于错误的输入产生决策。
|
||||
|
||||
在新工单中引用
屏蔽一个用户