SMAP/MSL

标签:数据集 / 异常检测 / 数据分析 / 数据
作者:赵浩天
时间:2023-12-07 19:55

标题*SMAP(Soil Moisture Active Passive satellite)/MSL(Mars Science Laboratory rover)
描述(主要说明数据集的(可能)用途、应用领域等;针对标注数据需要说明标注的类别标签)*

NASA收集的航天器多维时序数据

  • 1)时间信息匿名(时间粒度也是1min),数据已全被scale到0-1
  • 2)SMAP和MSL代表两个不同的产生遥测流的航天器,两个数据集分开
  • 3)SMAP有55个channel(实体),每个channel有25个维度
  • 4)MSL有27个channel(实体),每个channel有55个维度
  • 5)只有telemetry value是连续变量,其他变量都是相关命令(command)是否6)发送,实际就是0或者1(0为没发送,而1代表已发送)
  • 7)训练集无label,测试集有label
数据集描述标签(使用分号分隔多个关键字)*MTS、Anomaly Detection、多维时序、异常检测
使用信息.Licence 
数据来源(原始链接;如果是自产数据则标注为“自产”)*https://github.com/khundman/telemanom
数据采集方法 
数据拥有者 
数据分享者(提供此数据集信息的单位名称)*NASA
数据集创建时间 
数据规模(数据量、数据库行数、文件尺寸等信息)*

SMAP有55个channel(实体),每个channel有25个维度

MSL有27个channel(实体),每个channel有55个维度

数据集最近更新时间 
数据版本 
数据格式(数据存储方式、数据结构说明等)

分为三类文件

1)labeled_anomalies:数据处理和两个航天器数据分离依靠此文件

  • chan_id: 对应于train和test中对应名字的numpy文件。(对应实体)
  • spacecraft:chan_id所归属的SMAP或MSL
  • anomaly_sequence:对应test中chan_id文件中的index为此范围的为异常序列
  • class:有两种异常,point和contextual,前者点异常,后者是整体变化趋势异常
  • num_values: 对应chan_id的test文件的时间戳数量

2)train

3)test

引用(与此数据集相关的论文、项目、其他数据集等)出自论文:A framework for using LSTMs to detect anomalies in multivariate time series data
首页  |  去知了查看