AIOps 2021挑战赛答辩记录

2021/07/30 18:00:00 2021/07/30 18:00:00 note AIOps

1. 时空数据多指标预测

时空数据哪有几种

  • 图片+时间轴
  • 时间序列+空域关系

da83bb35b2ee1661e1c9a674721a092
2afb0700c4e39369712fbb8ea34e0aa
092efde5fcc1ead4c548ea92808792d
482d0beee98602dae12b360f6031d18
3e27d036423732fd15c7a62c1e1128c
58898959d166daba42e0ebb387b2f79
dd47545c4bd922d7b84c960ee7d4833
88c7451c8cc1e57e4d2eeb486c469df
30d0135c1f07ed84151f625d3d57a2e
6930d622e79c8636b9190138728649b

数据集

2b64a3575b3878a9420d6f72c5b7f68

挑战

  1. node edge均有异质性:
  • node:基站业务不同,数据分布不同
  • edge:node间有不同的关系(举例:来向与去向的高铁节点、小区间的节点)

87bc8f9f29b296c3f76e60b2802642e

  1. 缺乏连续性的假设:用户接入不受物理空间约束,可以瞬间从小区A接入到小区B

  2. 突发性

2e14a03c01af3b1caf0a662ee8a7146

  1. 网络结构复杂性(领区关系):不同区域,基站之间的连接密集程度有很大不同

175124e6e9fd50b498402605498cb46

自己的工作

强调自适应感受野,强调异质性

70fcdc172c8cedf6935d33ac839464a
37a65aed9e33e8fa09b12b8be7683c6
02bb2f207040d2afe6de2757b8c1e72
a0a14ff67f978b4ad952b64ff14c559
c16290875c6b0455c241f091633377a


2. 人机物融合智能运维:感知、诊断、交互

重点:需要融合人类知识到已有的时间序列、日志分析中

17bde0bb13da6f7b437d75aefb74218

主要分析日志数据,数据特点:半结构化、多言且复杂、不同组件、第三方组件日志的异质性。

难点

83e9edce68a0e8f224e3abf3e4536c4
ba672144e6d23c3ab8da3696835ddc1

分布式系统的特点

分布式系统,统一请求日志在数据中交替出现,而不唯一

29fb6e68dc5cf6736622b00546c8985

他们的工作

概述

e09e7e6521aabee6c58e6aa477b81cb

重点1:模型适应性问题,自学习、自更新的故障预测模型,human-in-loop

5f23f647ca6efef99e4caa69ee2a015

重点2:机器学习结果如何提高人类的运维水平,指导程序员设置meaningful的日志打印点(打印点越多,日志包含的信息越无用),实际效果大幅减少打印点、且提升了故障诊断准确度

f2b06778d60907994e463c2649ea753

重点3:CMDB相关

43bd7aa2f12acc7183ce089ab7d53f4
24f3046d112f0daa16561614fad677a
91c0926c0db9d0e85064f0f944e80e7

重点4:知识图图谱

2b060c89fc58c019e5d86588c8b2410
cbef862f03ea4a8d74de16e561aa09f

重点5:人机智能问答

f9b1bd79a7e34528ad30ea964f2116b
ACL2020_8dbe96fbf771796f37977008d26fc1e
IJCAI2020_668cd8dcc538e660acd07ea56ffa7c2


3. 落地经验

b307dd866403412e2fe07928660b09e