fix default pipeline and typo in README

4 years ago · c78f167688
--- a/README.md
+++ b/README.md
@@ -7,7 +7,7 @@
 TODS is a full-stack automated machine learning system for outlier detection on multivariate time-series data. TODS provides exhaustive modules for building machine learning-based outlier detection systems, including: data processing, time series processing, feature analysis (extraction), detection algorithms, and reinforcement module. The functionalities provided via these modules include data preprocessing for general purposes, time series data smoothing/transformation, extracting features from time/frequency domains, various detection algorithms, and involving human expertise to calibrate the system. Three common outlier detection scenarios on time-series data can be performed: point-wise detection (time points as outliers), pattern-wise detection (subsequences as outliers), and system-wise detection (sets of time series as outliers), and a wide-range of corresponding algorithms are provided in TODS. This package is developed by [DATA Lab @ Texas A&M University](https://people.engr.tamu.edu/xiahu/index.html).
 TODS is featured for:
 * **Full Sack Machine Learning System** which supports exhaustive components from preprocessings, feature extraction, detection algorithms and also human-in-the loop interface. 
 * **Full Stack Machine Learning System** which supports exhaustive components from preprocessings, feature extraction, detection algorithms and also human-in-the loop interface. 
 * **Wide-range of Algorithms**, including all of the point-wise detection algorithms supported by [PyOD](https://github.com/yzhao062/pyod), state-of-the-art pattern-wise (collective) detection algorithms such as [DeepLog](https://www.cs.utah.edu/~lifeifei/papers/deeplog.pdf), [Telemanon](https://arxiv.org/pdf/1802.04431.pdf), and also various ensemble algorithms for performing system-wise detection.
@@ -48,14 +48,14 @@ pip install -e .
 ```
 # Examples
 Examples are available in [/examples](examples/). For basic usage, you can evaluate a pipeline on a given datasets. Here, we provide an example to load our default pipeline and evaluate it on a subset of yahoo dataset.
 Examples are available in [/examples](examples/). For basic usage, you can evaluate a pipeline on a given datasets. Here, we provide example to load our default pipeline and evaluate it on a subset of yahoo dataset.
 ```python
 import pandas as pd
 from tods import schemas as schemas_utils
 from tods import generate_dataset, evaluate_pipeline
 table_path = 'datasets/yahoo_sub_5.csv'
 table_path = 'datasets/data/raw_data/yahoo_sub_5.csv'
 target_index = 6 # what column is the target
 metric = 'F1_MACRO' # F1 on both label 0 and 1
--- a/datasets/anomaly/kpi/SCORE/dataset_TEST/datasetDoc.json
+++ b/datasets/anomaly/kpi/SCORE/dataset_TEST/datasetDoc.json
--- a/datasets/anomaly/kpi/SCORE/dataset_TEST/tables/learningData.csv
+++ b/datasets/anomaly/kpi/SCORE/dataset_TEST/tables/learningData.csv
--- a/datasets/anomaly/kpi/SCORE/problem_TEST/dataSplits.csv
+++ b/datasets/anomaly/kpi/SCORE/problem_TEST/dataSplits.csv
--- a/datasets/anomaly/kpi/SCORE/problem_TEST/problemDoc.json
+++ b/datasets/anomaly/kpi/SCORE/problem_TEST/problemDoc.json
--- a/datasets/anomaly/kpi/SCORE/targets.csv
+++ b/datasets/anomaly/kpi/SCORE/targets.csv
--- a/datasets/anomaly/kpi/TEST/dataset_TEST/datasetDoc.json
+++ b/datasets/anomaly/kpi/TEST/dataset_TEST/datasetDoc.json
--- a/datasets/anomaly/kpi/TEST/dataset_TEST/tables/learningData.csv
+++ b/datasets/anomaly/kpi/TEST/dataset_TEST/tables/learningData.csv
--- a/datasets/anomaly/kpi/TEST/problem_TEST/dataSplits.csv
+++ b/datasets/anomaly/kpi/TEST/problem_TEST/dataSplits.csv
--- a/datasets/anomaly/kpi/TEST/problem_TEST/problemDoc.json
+++ b/datasets/anomaly/kpi/TEST/problem_TEST/problemDoc.json
--- a/datasets/anomaly/kpi/TRAIN/dataset_TRAIN/datasetDoc.json
+++ b/datasets/anomaly/kpi/TRAIN/dataset_TRAIN/datasetDoc.json
--- a/datasets/anomaly/kpi/TRAIN/dataset_TRAIN/tables/learningData.csv
+++ b/datasets/anomaly/kpi/TRAIN/dataset_TRAIN/tables/learningData.csv
--- a/datasets/anomaly/kpi/TRAIN/problem_TRAIN/dataSplits.csv
+++ b/datasets/anomaly/kpi/TRAIN/problem_TRAIN/dataSplits.csv
--- a/datasets/anomaly/kpi/TRAIN/problem_TRAIN/problemDoc.json
+++ b/datasets/anomaly/kpi/TRAIN/problem_TRAIN/problemDoc.json
--- a/datasets/anomaly/kpi/kpi_dataset/datasetDoc.json
+++ b/datasets/anomaly/kpi/kpi_dataset/datasetDoc.json
--- a/datasets/anomaly/kpi/kpi_dataset/tables/learningData.csv
+++ b/datasets/anomaly/kpi/kpi_dataset/tables/learningData.csv
--- a/datasets/anomaly/kpi/kpi_dataset/tables/learningData.csv.REMOVED.git-id
+++ b/datasets/anomaly/kpi/kpi_dataset/tables/learningData.csv.REMOVED.git-id
--- a/datasets/anomaly/kpi/kpi_problem/dataSplits.csv
+++ b/datasets/anomaly/kpi/kpi_problem/dataSplits.csv
--- a/datasets/anomaly/kpi/kpi_problem/dataSplits.csv.REMOVED.git-id
+++ b/datasets/anomaly/kpi/kpi_problem/dataSplits.csv.REMOVED.git-id
--- a/datasets/anomaly/kpi/kpi_problem/problemDoc.json
+++ b/datasets/anomaly/kpi/kpi_problem/problemDoc.json
--- a/datasets/anomaly/raw_data/kpi.csv
+++ b/datasets/anomaly/raw_data/kpi.csv
--- a/datasets/anomaly/raw_data/yahoo_sub_5.csv
+++ b/datasets/anomaly/raw_data/yahoo_sub_5.csv
--- a/datasets/anomaly/system_wise/sample/systems/0.csv
+++ b/datasets/anomaly/system_wise/sample/systems/0.csv
--- a/datasets/anomaly/system_wise/sample/systems/1.csv
+++ b/datasets/anomaly/system_wise/sample/systems/1.csv
--- a/datasets/anomaly/system_wise/sample/systems/10.csv
+++ b/datasets/anomaly/system_wise/sample/systems/10.csv
--- a/datasets/anomaly/system_wise/sample/systems/100.csv
+++ b/datasets/anomaly/system_wise/sample/systems/100.csv
--- a/datasets/anomaly/system_wise/sample/systems/101.csv
+++ b/datasets/anomaly/system_wise/sample/systems/101.csv
--- a/datasets/anomaly/system_wise/sample/systems/102.csv
+++ b/datasets/anomaly/system_wise/sample/systems/102.csv
--- a/datasets/anomaly/system_wise/sample/systems/103.csv
+++ b/datasets/anomaly/system_wise/sample/systems/103.csv
--- a/datasets/anomaly/system_wise/sample/systems/104.csv
+++ b/datasets/anomaly/system_wise/sample/systems/104.csv
--- a/datasets/anomaly/system_wise/sample/systems/105.csv
+++ b/datasets/anomaly/system_wise/sample/systems/105.csv
--- a/datasets/anomaly/system_wise/sample/systems/106.csv
+++ b/datasets/anomaly/system_wise/sample/systems/106.csv
--- a/datasets/anomaly/system_wise/sample/systems/107.csv
+++ b/datasets/anomaly/system_wise/sample/systems/107.csv
--- a/datasets/anomaly/system_wise/sample/systems/108.csv
+++ b/datasets/anomaly/system_wise/sample/systems/108.csv
--- a/datasets/anomaly/system_wise/sample/systems/109.csv
+++ b/datasets/anomaly/system_wise/sample/systems/109.csv
--- a/datasets/anomaly/system_wise/sample/systems/11.csv
+++ b/datasets/anomaly/system_wise/sample/systems/11.csv
--- a/datasets/anomaly/system_wise/sample/systems/110.csv
+++ b/datasets/anomaly/system_wise/sample/systems/110.csv
--- a/datasets/anomaly/system_wise/sample/systems/111.csv
+++ b/datasets/anomaly/system_wise/sample/systems/111.csv
--- a/datasets/anomaly/system_wise/sample/systems/112.csv
+++ b/datasets/anomaly/system_wise/sample/systems/112.csv
--- a/datasets/anomaly/system_wise/sample/systems/113.csv
+++ b/datasets/anomaly/system_wise/sample/systems/113.csv
--- a/datasets/anomaly/system_wise/sample/systems/114.csv
+++ b/datasets/anomaly/system_wise/sample/systems/114.csv
--- a/datasets/anomaly/system_wise/sample/systems/115.csv
+++ b/datasets/anomaly/system_wise/sample/systems/115.csv
--- a/datasets/anomaly/system_wise/sample/systems/116.csv
+++ b/datasets/anomaly/system_wise/sample/systems/116.csv
--- a/datasets/anomaly/system_wise/sample/systems/117.csv
+++ b/datasets/anomaly/system_wise/sample/systems/117.csv
--- a/datasets/anomaly/system_wise/sample/systems/118.csv
+++ b/datasets/anomaly/system_wise/sample/systems/118.csv
--- a/datasets/anomaly/system_wise/sample/systems/119.csv
+++ b/datasets/anomaly/system_wise/sample/systems/119.csv
--- a/datasets/anomaly/system_wise/sample/systems/12.csv
+++ b/datasets/anomaly/system_wise/sample/systems/12.csv
--- a/datasets/anomaly/system_wise/sample/systems/120.csv
+++ b/datasets/anomaly/system_wise/sample/systems/120.csv
--- a/datasets/anomaly/system_wise/sample/systems/121.csv
+++ b/datasets/anomaly/system_wise/sample/systems/121.csv
--- a/datasets/anomaly/system_wise/sample/systems/122.csv
+++ b/datasets/anomaly/system_wise/sample/systems/122.csv
--- a/datasets/anomaly/system_wise/sample/systems/123.csv
+++ b/datasets/anomaly/system_wise/sample/systems/123.csv
--- a/datasets/anomaly/system_wise/sample/systems/124.csv
+++ b/datasets/anomaly/system_wise/sample/systems/124.csv
--- a/datasets/anomaly/system_wise/sample/systems/125.csv
+++ b/datasets/anomaly/system_wise/sample/systems/125.csv
--- a/datasets/anomaly/system_wise/sample/systems/126.csv
+++ b/datasets/anomaly/system_wise/sample/systems/126.csv
--- a/datasets/anomaly/system_wise/sample/systems/127.csv
+++ b/datasets/anomaly/system_wise/sample/systems/127.csv
--- a/datasets/anomaly/system_wise/sample/systems/128.csv
+++ b/datasets/anomaly/system_wise/sample/systems/128.csv
--- a/datasets/anomaly/system_wise/sample/systems/129.csv
+++ b/datasets/anomaly/system_wise/sample/systems/129.csv
--- a/datasets/anomaly/system_wise/sample/systems/13.csv
+++ b/datasets/anomaly/system_wise/sample/systems/13.csv
--- a/datasets/anomaly/system_wise/sample/systems/130.csv
+++ b/datasets/anomaly/system_wise/sample/systems/130.csv
--- a/datasets/anomaly/system_wise/sample/systems/131.csv
+++ b/datasets/anomaly/system_wise/sample/systems/131.csv
--- a/datasets/anomaly/system_wise/sample/systems/132.csv
+++ b/datasets/anomaly/system_wise/sample/systems/132.csv
--- a/datasets/anomaly/system_wise/sample/systems/133.csv
+++ b/datasets/anomaly/system_wise/sample/systems/133.csv
--- a/datasets/anomaly/system_wise/sample/systems/134.csv
+++ b/datasets/anomaly/system_wise/sample/systems/134.csv
--- a/datasets/anomaly/system_wise/sample/systems/135.csv
+++ b/datasets/anomaly/system_wise/sample/systems/135.csv
--- a/datasets/anomaly/system_wise/sample/systems/136.csv
+++ b/datasets/anomaly/system_wise/sample/systems/136.csv
--- a/datasets/anomaly/system_wise/sample/systems/137.csv
+++ b/datasets/anomaly/system_wise/sample/systems/137.csv
--- a/datasets/anomaly/system_wise/sample/systems/138.csv
+++ b/datasets/anomaly/system_wise/sample/systems/138.csv
--- a/datasets/anomaly/system_wise/sample/systems/139.csv
+++ b/datasets/anomaly/system_wise/sample/systems/139.csv
--- a/datasets/anomaly/system_wise/sample/systems/14.csv
+++ b/datasets/anomaly/system_wise/sample/systems/14.csv
--- a/datasets/anomaly/system_wise/sample/systems/140.csv
+++ b/datasets/anomaly/system_wise/sample/systems/140.csv
--- a/datasets/anomaly/system_wise/sample/systems/141.csv
+++ b/datasets/anomaly/system_wise/sample/systems/141.csv
--- a/datasets/anomaly/system_wise/sample/systems/142.csv
+++ b/datasets/anomaly/system_wise/sample/systems/142.csv
--- a/datasets/anomaly/system_wise/sample/systems/143.csv
+++ b/datasets/anomaly/system_wise/sample/systems/143.csv
--- a/datasets/anomaly/system_wise/sample/systems/144.csv
+++ b/datasets/anomaly/system_wise/sample/systems/144.csv
--- a/datasets/anomaly/system_wise/sample/systems/145.csv
+++ b/datasets/anomaly/system_wise/sample/systems/145.csv
--- a/datasets/anomaly/system_wise/sample/systems/146.csv
+++ b/datasets/anomaly/system_wise/sample/systems/146.csv
--- a/datasets/anomaly/system_wise/sample/systems/147.csv
+++ b/datasets/anomaly/system_wise/sample/systems/147.csv
--- a/datasets/anomaly/system_wise/sample/systems/148.csv
+++ b/datasets/anomaly/system_wise/sample/systems/148.csv
--- a/datasets/anomaly/system_wise/sample/systems/149.csv
+++ b/datasets/anomaly/system_wise/sample/systems/149.csv
--- a/datasets/anomaly/system_wise/sample/systems/15.csv
+++ b/datasets/anomaly/system_wise/sample/systems/15.csv
--- a/datasets/anomaly/system_wise/sample/systems/150.csv
+++ b/datasets/anomaly/system_wise/sample/systems/150.csv
--- a/datasets/anomaly/system_wise/sample/systems/151.csv
+++ b/datasets/anomaly/system_wise/sample/systems/151.csv
--- a/datasets/anomaly/system_wise/sample/systems/152.csv
+++ b/datasets/anomaly/system_wise/sample/systems/152.csv
--- a/datasets/anomaly/system_wise/sample/systems/153.csv
+++ b/datasets/anomaly/system_wise/sample/systems/153.csv
--- a/datasets/anomaly/system_wise/sample/systems/154.csv
+++ b/datasets/anomaly/system_wise/sample/systems/154.csv
--- a/datasets/anomaly/system_wise/sample/systems/155.csv
+++ b/datasets/anomaly/system_wise/sample/systems/155.csv
--- a/datasets/anomaly/system_wise/sample/systems/156.csv
+++ b/datasets/anomaly/system_wise/sample/systems/156.csv
--- a/datasets/anomaly/system_wise/sample/systems/157.csv
+++ b/datasets/anomaly/system_wise/sample/systems/157.csv
--- a/datasets/anomaly/system_wise/sample/systems/158.csv
+++ b/datasets/anomaly/system_wise/sample/systems/158.csv
--- a/datasets/anomaly/system_wise/sample/systems/159.csv
+++ b/datasets/anomaly/system_wise/sample/systems/159.csv
--- a/datasets/anomaly/system_wise/sample/systems/16.csv
+++ b/datasets/anomaly/system_wise/sample/systems/16.csv
--- a/datasets/anomaly/system_wise/sample/systems/160.csv
+++ b/datasets/anomaly/system_wise/sample/systems/160.csv
--- a/datasets/anomaly/system_wise/sample/systems/161.csv
+++ b/datasets/anomaly/system_wise/sample/systems/161.csv
--- a/datasets/anomaly/system_wise/sample/systems/162.csv
+++ b/datasets/anomaly/system_wise/sample/systems/162.csv
--- a/datasets/anomaly/system_wise/sample/systems/163.csv
+++ b/datasets/anomaly/system_wise/sample/systems/163.csv
--- a/datasets/anomaly/system_wise/sample/systems/164.csv
+++ b/datasets/anomaly/system_wise/sample/systems/164.csv
--- a/datasets/anomaly/system_wise/sample/systems/165.csv
+++ b/datasets/anomaly/system_wise/sample/systems/165.csv
--- a/datasets/anomaly/system_wise/sample/systems/166.csv
+++ b/datasets/anomaly/system_wise/sample/systems/166.csv
--- a/datasets/anomaly/system_wise/sample/systems/167.csv
+++ b/datasets/anomaly/system_wise/sample/systems/167.csv
--- a/datasets/anomaly/system_wise/sample/systems/168.csv
+++ b/datasets/anomaly/system_wise/sample/systems/168.csv