本文为类型b:学术综述论文
作者与发表信息
本文由美国康涅狄格大学的Chiranjit Dutta与Nalini Ravishanker、明德学院的Kara Karpman以及康奈尔大学的Sumanta Basu合作完成,发表于《Sankhyā b: The Indian Journal of Statistics》2022年卷。
主题概述
本文系统综述了高频交易(High-Frequency Trading, HFT)数据的统计建模方法,探讨了HFT数据的特点、现有分析框架、开放性问题及其在金融经济领域的应用价值。
高频交易数据具有以下核心特征:
- 非规则时间间隔(Irregular Spacing):交易事件异步发生,导致时间序列间隔不固定(如纽交所的逐笔数据)。
- 日内周期效应(Diurnal Effect):市场开盘和收盘时段交易活跃,中午活跃度下降,需通过三次样条等方法修正。
- 非负性与时间依赖性:价格、交易量等变量非负且呈现强自相关性,传统时间序列模型需调整(如GARCH模型需适应长记忆性)。
- 异步交易(Asynchronous Trading):不同资产交易频率差异导致跨资产相关性估计偏差(如Epps效应)。
- 价格跳跃(Jumps):由宏观经济事件或突发新闻引发,需通过跳跃-扩散模型(Jump-Diffusion Models)或Lévy过程建模。
支持案例:文中以美国银行(BAC)和3M(MMM)的逐笔数据为例,展示价格阈值法和美元交易量法构建的交易间隔(durations)分布及自相关图(图1)。
通过分箱(如1分钟、5分钟)将高频数据转化为规则时间序列,应用以下模型:
- GARCH及其扩展:捕捉波动聚集性(如EGARCH处理杠杆效应)。
- 随机波动模型(Stochastic Volatility, SV):通过潜变量描述波动随机演化,适用于长记忆性数据。
- Realized GARCH:结合实现波动率(Realized Volatility)提升预测精度(如Dow Jones成分股的应用)。
局限性:分箱导致信息丢失,且忽略日内周期性。
highfrequency提供Barndorff-Nielsen跳跃检验和Lee-Mykland日内跳跃检测。通过强度函数(Intensity Function,式4.15)描述事件到达率,包括:
- Hawkes过程:自激励特性模拟信息传染效应。
- 比例风险模型(Cox Model):分析事件间隔的协变量影响。
acdm、stochvol)代码。科学意义:为量化金融、市场监管(如闪崩分析)和算法交易提供方法论基础,同时促进时间序列计量经济学的跨学科应用。