本篇文档属于类型b(特刊编者按),以下是针对该内容的学术报告:
作者及机构:
- Jie Lu(澳大利亚悉尼科技大学人工智能研究所)
- Joao Gama(葡萄牙波尔图大学经济学院)
- Xin Yao(中国南方科技大学计算机科学与工程系)
- Leandro Minku(英国伯明翰大学计算机学院)
发表信息:2023年10月发表于期刊《IEEE Transactions on Neural Networks and Learning Systems》第34卷第10期。
本期特刊聚焦“流学习(stream learning)”这一新兴研究方向。随着动态环境和实时数据需求的增长,流学习通过处理连续数据流(如在线学习、增量学习和概念漂移检测等技术),已成为机器学习与数据科学领域的热点。特刊旨在整合流学习的基础理论与应用成果,推动其在动态系统、实时决策等场景中的发展。
观点:流学习的核心在于应对数据分布的动态变化(即概念漂移,concept drift)和实时模型更新。
论据:
- 概念漂移检测:需解决漂移发生位置、时间及机制识别问题(如文献[A7]通过信号处理框架实现漂移跟踪)。
- 模型适应性:包括主动/被动更新策略(如文献[A10]提出基于重要性加权的漂移适应算法)。
- 技术融合:在线学习、强化学习等与传统机器学习结合(如文献[A3]提出动态非对称查询策略解决类别不平衡)。
特刊将21篇入选论文分为五类,每类反映流学习的不同研究维度:
2.1 在线学习与主动学习(6篇)
- 创新点:
- [A1]基于共振理论(resonance theory)的无监督在线学习模型,提升顺序敏感性鲁棒性。
- [A2]多层在线度量学习框架(multilayer online metric learning),通过马氏距离(Mahalanobis-based)捕捉非线性相似性。
- 意义:为动态数据流中的实时分类与特征选择提供新方法。
2.2 概念漂移检测理论与应用(3篇)
- 创新点:
- [A8]提出基于单直方图的多模态批量漂移检测算法,适用于跨领域数据流。
- [A9]通过双向概念认知学习(two-way concept-cognitive learning)降低时间消耗。
- 意义:为动态环境下的漂移分析提供理论保障。
2.3 漂移适应与领域自适应(5篇)
- 创新点:
- [A12]针对极端标签短缺场景,提出跨域深度聚类网络(flexible deep clustering network)。
- [A14]结合元学习与张量方法(tensor-meta-learning),缓解少样本任务中的域偏移(domain shift)。
- 意义:扩展流学习在数据异构场景的适用性。
2.4 数据流挖掘新方法(3篇)
- 创新点:
- [A15]半监督流数据挖掘算法,解决新类别检测与有限标注的矛盾。
- [A16]通过神经过程(neural process)估计局部与全局不确定性。
- 意义:揭示数据流中的隐含模式与不确定性机制。
2.5 流学习的实际应用(4篇)
- 典型案例:
- [A18]双向时空自适应Transformer用于城市交通流量预测。
- [A19]基于情感强度与PU学习的虚假评论检测模型。
- 价值:验证流学习在医疗、安防等领域的落地潜力。
本特刊通过整合前沿研究,为流学习领域树立了新的技术标杆,并为后续研究指明方向(如多模态漂移检测、少样本适应等)。