这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的详细学术报告:
本研究由Changsheng Li(电子科技大学计算机科学与工程学院及大数据研究中心)、Fan Wei(斯坦福大学数学系)、Weishan Dong(百度搜索)、Xiangfeng Wang(华东师范大学软件工程学院)、Qingshan Liu(南京信息工程大学信息与控制学院B-DAT实验室)和Xin Zhang(IBM研究院)共同完成。论文发表于IEEE Transactions on Pattern Analysis and Machine Intelligence期刊,2019年2月第41卷第2期。
该研究属于机器学习领域,具体聚焦于在线多输出回归(online multiple-output regression)问题。随着数据流(如金融市场在线交易、互联网流量等)的广泛应用,传统批处理模式的多输出回归方法面临计算复杂度高、内存需求大等问题。现有在线学习方法如PA(Passive-Agressive)算法和IS-PLS未能充分挖掘输出间的相关性信息,且对残差误差的结构缺乏建模。因此,本研究旨在开发一种能够动态学习回归系数结构和残差结构的新型在线多输出回归方法。
研究的主要目标包括: 1. 动态学习回归系数变化的结构 2. 利用残差误差的结构提高预测精度 3. 通过改进的协方差矩阵提取必要信息 4. 引入遗忘因子适应数据流的演化特性 5. 开发高效的优化算法和在线特征值分解算法
研究首先定义了在线多输出回归的基本框架:在第t轮,学习者观察到一个实例xt∈R^d,基于当前模型Pt-1∈R^(m×d)预测多个输出yt∈R^m,然后接收真实响应yt∈R^m并更新模型。预测形式为:yt+1 = Pt*xt+1 + εt+1,其中Pt为回归系数矩阵,εt+1为残差向量。
研究提出了创新的目标函数:
(pt,vt,gt) = argmin(p,v,g) [‖p-pt-1‖_v^2 + αℓ(p,g,St) + βDf(v,vt-1) + ρDf(v,I) + ηDf(g,I)] 其中: - 第一项使用马氏距离(Mahalanobis distance)度量回归系数变化 - 第二项ℓ(p,g,St)为预测误差函数,采用带遗忘因子μ的加权设计 - 后三项为调节项,保证矩阵的正定性
研究特别设计了三个改进的协方差矩阵Ct,yy、Ct,xy和Ct,xx来增量存储历史信息,避免了全数据加载。这些矩阵通过递归方式更新:
Ct,yy = μCt-1,yy + ytyt^T Ct,xy = μCt-1,xy + xtyt^T Ct,xx = μCt-1,xx + xtxt^T 研究采用交替优化策略求解目标函数:
给定vt-1和gt-1,通过求解矩阵方程获得Pt。对于高维输入,开发了基于Frequent Directions(FD)算法的在线特征值分解方法,将复杂度从O(d^3)降至O(dl^2),其中l为草图尺寸。
采用闭合形式解:
vt = [1/(β+ρ)(βvt-1^-1 + ρI + M)]^-1 其中M=(pt-pt-1)(pt-pt-1)^T。研究证明vt始终正定且特征值在0和1之间。
同样获得闭合形式解:
gt = (I + η/α N)^-1 其中N为残差协方差矩阵。研究证明gt也是正定的。
研究在两个合成数据集和三个真实数据集(股票价格预测、Barrett WAM机器人逆动力学、气象预测)上验证方法有效性,比较算法包括IS-PLS、ELLA、OMTL、PA-I和PA-II等。
实验设计: 1. 参数设置:β=ρ=1,η=100,α从{10^-2,…,10^4}调优,μ从0到1以0.1步长调优 2. 评价指标:平均绝对误差(MAE) 3. 重复实验:10次随机顺序实验取平均
在模拟数据上: - 证明了Pt收敛于真实系数矩阵(图1a) - 展示了方法能有效学习回归系数差异的相关性(表1a)和残差误差的相关性(表1b) - 当数据分布变化时(t>500),方法能自适应学习新的结构(表1e-1h)