model-lab/pcamtcltest_recon.py


								#!/usr/bin/python3.6.5

								# -*- coding: utf-8 -*-

								# Time     : 2020/3/29 23:03

								# Author  : HeKang

								# Github : https://github.com/JustKeepSilence


								import time

								import numpy as np

								import pandas as pd

								from scipy.stats import norm

								from scipy.stats.distributions import chi2

								import json

								from json import JSONDecodeError

								import sys

								import traceback

								import pymssql

								import requests

								import datetime

								from scipy.stats import norm

								from scipy.stats import f

								from scipy.stats import chi2

								import jenkspy

								# import pca_train_k

								import pcamtcltest_k

								# import model_performance

								import xlrd

								import random

								from pylab import mpl

								import matplotlib.pyplot as plt

								from collections import Counter

								from operator import itemgetter

								import PCA_Test

								import config

								from recon import Lars, recon_fault_diagnosis_r, recon_fault_diagnosis_r_l, recon_fault_diagnosis_r_c


								def pca(model, LockVariable,Data_origin,number_sample, number_fault_variable,

								        low_f,high_f,Test_type,Limit_value, time_data, spe_recon,expand=True, sort_data=False):

								    if len(low_f) >= 12:

								        para_length = 3

								    elif 12 > len(low_f) >= 7:

								        para_length = 2

								    else:

								        para_length = 1

								    low_f=np.array(low_f)/np.array(model["Train_X_std"])  # 对最低幅度归一�?

								    high_f=np.array(high_f)/np.array(model["Train_X_std"])  # 对最高幅度归一�?

								    yy = list(range(0, Data_origin.shape[0]))

								    time_sample = []

								    if expand:

								        # random_row = np.random.choice(a=yy, size=number_sample)

								        if len(yy) < 1000:

								            random_row = np.array(list(range(len(yy))))

								        else:

								            random_row = np.array(random.sample(yy, number_sample))

								        time_original = time_data[random_row, :]

								        Data_origin = Data_origin[random_row, :]  # 扩充选择1000个样�?

								    else:

								        # random_row = np.array(random.sample(yy, number_sample))

								        random_row = np.random.choice(a=yy, size=number_sample)

								        time_original = time_data[random_row, :]

								        Data_origin = Data_origin[random_row, :]  # 扩充选择random_row个样�?

								    Data = (Data_origin - model["Train_X_mean"]) / model["Train_X_std"]

								    featValue = np.array(model["featValue"])+0.00001  # 训练数据的特征�?

								    featVec = np.array(model["featVec"])  # 训练数据的特征向�?

								    numbel_variable = featValue.shape[0]

								    k = (model["K"])  # 主元个数

								    selectVec = featVec[:, 0:k]  ####自己选择�?

								    featValue_sort = featValue  # [index]  # 排序后的特征�?

								    ############----------*********-SPE-**************----------########################


								    # LockVariable="3,5"


								    C_ = np.eye(numbel_variable) - np.dot(selectVec, selectVec.T)

								    X_SPE = C_.T

								    D_SPE = C_

								    DIAG_SPE = np.eye(numbel_variable)


								    ############----------*********-T2-**************----------########################

								    DIAG_T2 = np.linalg.pinv(np.diag(featValue_sort[:int(model["K"])]))

								    D_T2 = selectVec.copy()

								    X_T2 = np.dot(D_T2, np.linalg.cholesky(DIAG_T2)).T


								    ############----------*********-综合指标-**************----------########################

								    II = featValue_sort.copy()

								    II[:int(model["K"])] = II[:int(model["K"])] * model["T2CUL_99"]

								    II[int(model["K"]):] = model["QCUL_99"]

								    DIAG_Fai = np.linalg.inv(np.diag(II))

								    D_Fai = featVec.copy()

								    X_Fai = np.dot(D_Fai, np.linalg.cholesky(DIAG_Fai)).T

								    # ************************调用LARS*******************************

								    t = 50000

								    original_line, recon_line = [], []

								    limit_line=float(Limit_value)

								    beta_path = []

								    SPE_list = []

								    FAI_list = []

								    Fault_noise = np.zeros([np.array(Data_origin).shape[0], np.array(Data_origin).shape[1]])  # 故障变化幅度

								    Fault_index = np.zeros([np.array(Data_origin).shape[0], np.array(Data_origin).shape[1]])  # 真实故障方向

								    paraState = np.zeros([np.array(Data_origin).shape[0], np.array(Data_origin).shape[1]])  # 故障重构的方�?

								    index_num, index_point = [], []

								    all_FDR = []

								    all_FAR = []

								    fault_free = []

								    fdr = {}

								    far = {}

								    beta_pro = []

								    fault_index_row = []

								    plots_matrix = []  # 贡献图法的矩�?

								    plots_index = []  # 贡献图法的index

								    findex = np.where(low_f != 0)[0]  # 判断加在那个参数�?

								    for ii in range(Data.shape[0]):

								        Y = Data[ii, :]  # 测试数据的每一�?

								        noise=[]

								        for j in range(number_fault_variable):

								            noise.append(np.random.uniform(low_f[findex[j]], high_f[findex[j]]))  # 均匀分布

								        Fault_index[ii, findex] = 1

								        Fault_noise[ii, findex] = noise

								        if Test_type == "FAI":

								            original_line.append(Y @ D_Fai @ DIAG_Fai @ D_Fai.T @ Y.T)

								        elif Test_type == "SPE":

								            original_line.append(Y @ X_SPE.T @ X_SPE @ Y.T)

								        Y = Y + Fault_noise[ii, :]

								        #########*********************计算SPE******************************

								        SPE_line = np.dot(Y, C_).dot(Y.T)

								        SPE_list.append(SPE_line)

								        #########################计算综合指标##########

								        FAI_list.append(np.dot(Y.T, D_Fai).dot(DIAG_Fai).dot(D_Fai.T).dot(Y))

								        # **************计算LARS***************

								        if Test_type=="FAI":

								            beta, mse = Lars(X_Fai, Y, D_Fai, DIAG_Fai, t, limit_line, LockVariable)

								        elif Test_type=="SPE":

								            beta, mse = Lars(X_SPE, Y, D_SPE, DIAG_SPE, t, limit_line, LockVariable)

								        else:

								            beta, mse = Lars(X_T2, Y, D_T2, DIAG_T2,  t, limit_line, LockVariable)

								        beta_end = abs(beta[-1, :])

								        pi = len(beta_end)

								        if pi > 7:

								            jenk = jenkspy.jenks_breaks(beta_end, 5)

								        else:

								            jenk = jenkspy.jenks_breaks(beta_end, 2)

								        limt = (jenk[1] + jenk[2]) / 2

								        index = np.where(beta_end > 0)[0]

								        fault_index_row.append(ii)

								        if len(index) > para_length:

								            if Test_type == "SPE" and np.linalg.det(X_SPE @ X_SPE.T) > 1e-15:

								                res = recon_fault_diagnosis_r(Y, X_SPE @ X_SPE.T, limit_line, list(zip(index, beta_end[index])), model, True,

								                                              X_SPE @ X_SPE.T, LockVariable, selectVec, None)

								                if not isinstance(res[0], list):

								                    if res[1] == "plot":

								                        # beta[-1, :] = res[0]

								                        plots_matrix.append(res[0])

								                        plots_index.append(ii)

								                    else:

								                        beta[-1, :], index = res[0].T, res[1]

								            elif Test_type == "FAI" and np.linalg.det( D_Fai @ DIAG_Fai @ D_Fai.T) > 1e-15:

								                res = recon_fault_diagnosis_r_c(Y, D_Fai @ DIAG_Fai @ D_Fai.T, limit_line,

								                                                list(zip(index, beta_end[index])), model,

								                                                True, X_SPE @ X_SPE.T, LockVariable, selectVec, rbc=None)

								                if not isinstance(res[0], list):

								                    if res[1] == "plot":

								                        # beta[-1, :] = res[0]

								                        plots_matrix.append(res[0])

								                        plots_index.append(ii)

								                    else:

								                        beta[-1, :], index = res[0].T, res[1]

								        elif len(index) <= para_length and len(index) != 0:

								            if Test_type == "SPE":

								                res = recon_fault_diagnosis_r_l(Y, X_SPE @ X_SPE.T, index)

								                beta[-1, :], index = res[0].T, res[1]

								            elif Test_type == "FAI":

								                res = recon_fault_diagnosis_r_l(Y, D_Fai @ DIAG_Fai @ D_Fai.T, index)

								                beta[-1, :], index = res[0].T, res[1]

								        paraState[ii, index] = 1

								        beta_new = beta[-1, :] * paraState[ii, :]

								        beta_path.append(beta_new)

								        ############################################################

								        if index.shape[0]==0:

								            fault_free.append(ii)

								        ##### 统计fault detection rate (FDR)

								        d = [x for x in index if x in findex]

								        all_FDR.append(len(d) / (len(findex)+0.000001))

								        ##计算单个参数的fdr

								        for i in findex:

								            if i not in fdr:

								                if i in index:

								                    fdr.update({i: [1]})

								                else:

								                    fdr.update({i: [0]})

								            else:

								                if i in index:

								                    fdr[i].append(1)

								                else:

								                    fdr[i].append(0)

								        ###### 统计false alarm rate（FAR)

								        a = [x for x in index if x not in d]

								        all_FAR.append(len(a) / ((numbel_variable - len(findex))+0.0001))

								        ###统计单个参数的far

								    beta_path = np.array(beta_path)

								    FDR = sum(all_FDR) / Data.shape[0]#诊出�?

								    FAR = sum(all_FAR) / Data.shape[0]#误诊�?

								    fdr_variable = []#单参数诊出率

								    far_variable = []#单参数误诊率

								    for variable in range(numbel_variable):

								        if variable not in fdr:

								            fdr_variable.append(0)

								            far_variable.append(0)

								        else:

								            fdr_variable.append(sum(fdr[variable]) / len(fdr[variable]))

								            far_variable.append(FAR)

								    fault_data=Data+Fault_noise

								    fault_data = fault_data[fault_index_row, :]

								    Fault_data=np.add(np.multiply(fault_data, model["Train_X_std"]), model["Train_X_mean"])

								    finalData = fault_data - beta_path

								    reconData = np.add(np.multiply(finalData, model["Train_X_std"]), model["Train_X_mean"])  # 重构�?

								    if len(plots_matrix) != 0:

								        reconData[plots_index] = plots_matrix

								    Data_origin = Data_origin[fault_index_row, :]

								    real_error_data = Data_origin - reconData

								    errorData = sum(abs(Data_origin - reconData)) # 偏差�?

								    Reconstruction_precision=errorData/Data.shape[0]

								    test_data = np.around(Data_origin.T, decimals=3).tolist()

								    error_data = np.around(real_error_data.T, decimals=3).tolist()

								    time_stamp = time_original.T.tolist()[0]

								    max_recon = list(zip(np.max(beta_path, axis=0).tolist(), np.min(beta_path, axis=0).tolist()))

								    train_mean = model["Train_X_mean"]

								    train_std = model["Train_X_std"]

								    items = [

								             ('fdr_variable', np.around(fdr_variable, decimals=3).tolist()),

								             ('far_variable', np.around(far_variable, decimals=3).tolist()),

								             ('Reconstruction_precision', np.around(Reconstruction_precision, decimals=3).tolist()),

								             ("error_data", error_data),

								             ("test_data", test_data),

								        ("original_line", original_line),

								        ("time_stamp", time_stamp),

								        ("max_recon", max_recon),

								        ("mean", train_mean),

								        ("std", train_std)

								    ]

								    result = dict(items)

								    return result


								def isnumber(limits):

								    flag = True

								    for item in limits:

								        item = item.replace("-","")

								        if not item.isdigit():

								            flag = False

								            break

								    return flag


								def cleanmain(info):

								    try:

								        ItemsInfo, SamplingTimePeriods = [], []

								        model_id = info["Model_id"]

								        version = info["version"]

								        if version == "v-test":

								            res = PCA_Test.get_model_by_ID(model_id)

								        else:

								            res = PCA_Test.get_model_by_id_and_version(model_id, version)

								        lock = []

								        point_info = res["pointInfo"]

								        interval = info["Test_Data"]["interval"]

								        for i in range(len(point_info)):

								            try:

								                if point_info[i]["lock"]:

								                    lock.append(i)

								            except:

								                continue

								        Test_Data = info["Test_Data"]

								        points = Test_Data["points"].split(",")

								        try:

								            times = Test_Data["time"].split(";")

								            for i in range(len(times)):

								                Eachsampletime = {}

								                timess = times[i].split(',')

								                Eachsampletime["StartingTime"] = timess[0]

								                Eachsampletime["TerminalTime"] = timess[1]

								                SamplingTimePeriods.append(Eachsampletime)

								        except KeyError:

								            SamplingTimePeriods = [{"StartingTime": item["st"],

								                                    "TerminalTime": item["et"]} for item in res["trainTime"]]

								        model = res["para"]["Model_info"]

								        condition = info["condition"].replace("=", "==").replace(">=", ">").replace("<=", "<")

								        dead = info["dead"].split(',')

								        limit = info["limit"].split(',')

								        uplower = info["uplow"].split(';')

								        count = 0

								        Constraint = ""

								        for i in range(len(points)):

								            iteminfo = {}

								            iteminfo["ItemName"] = points[i]  # 加点

								            if dead[i] == "1":  # 判断是否参与死区清洗

								                iteminfo["ClearDeadZone"] = "true"

								            else:

								                iteminfo["ClearDeadZone"] = "false"

								            if limit[i] == "1":  # 参与上下限清�?

								                limits = uplower[i].split(',')

								                if isnumber(limits):  # 输入上下限正�?

								                    count += 1

								                    Constraint += "[" + points[i] + "]>" + limits[0] + " and " + "[" + points[i] + "]<" + limits[

								                        1] + " and "

								            ItemsInfo.append(iteminfo)

								        if count != 0:

								            Constraint = Constraint[:len(Constraint) - 4:]

								        else:

								            Constraint = "1==1"  # 没有上下限清�?

								        Constraint += " and (" + condition + ")"

								        Constraint = Constraint.replace("\n", " ")

								        url = f"http://{config._CLEAN_IP}/exawebapi/exatime/GetCleaningData?ItemsInfo=%s&SamplingTimePeriods=%s&Constraint=%s&SamplingPeriod=%s&DCount=6" % (

								            ItemsInfo, SamplingTimePeriods, Constraint, interval)

								        response = requests.get(url)

								        content = json.loads(response.text)

								        data = np.array([item for item in content["ClearData"]]).T  # test data

								        time_data = np.array([item for item in content["TimeData"]]).reshape(data.shape[0], -1)

								        try:

								            data = np.array(info["data"])

								        except KeyError:

								            pass

								        number_sample = info["number_sample"]

								        number_fault_variable = info["number_fault_variable"]

								        low_f = [float(item) for item in info["low_f"].split(',')]

								        high_f = [float(item) for item in info["high_f"].split(',')]

								        test_type = info["Test_Type"]

								        limit_value = info["Limit_Value"]

								        try:

								            expand = info["expand"]

								            # sort_data = info["sort_data"]

								        except KeyError:

								            expand = True

								            # sort_data = True

								        spe_recon = False

								        result = pca(model, lock, data, number_sample, number_fault_variable, low_f, high_f, test_type,

								                                   limit_value,time_data,spe_recon, expand)

								        try:

								            index = Test_Data["time"].index(",")

								            result["time"] = Test_Data["time"][:index:]

								        except KeyError:

								            result["time"] = sorted(res["trainTime"], key=lambda item: item["st"])[0]["st"]

								        result["BeforeCleanSamNum"] = content["BeforeCleanSamNum"]

								        result["AfterCleanSamNum"] = content["AfterCleanSamNum"]

								        result["amplitude"] = high_f

								        result["CleanOrNot"] = True

								        return result

								    except Exception as e:

								        msg = traceback.format_exc()

								        result = [{"CleanOrNot": False, 'msg': msg}]

								    return result


								def main(info):

								    try:

								        ItemsInfo, SamplingTimePeriods = [], []

								        model_id = info["Model_id"]

								        version = info["version"]

								        if version == "v-test":

								            res = PCA_Test.get_model_by_ID(model_id)

								        else:

								            res = PCA_Test.get_model_by_id_and_version(model_id, version)

								        lock = []

								        point_info = res["pointInfo"]

								        interval = info["Test_Data"]["interval"]

								        for i in range(len(point_info)):

								            try:

								                if point_info[i]["lock"]:

								                    lock.append(i)

								            except:

								                continue

								        Test_Data = info["Test_Data"]

								        points = Test_Data["points"].split(",")

								        try:

								            times = Test_Data["time"].split(";")

								            for i in range(len(times)):

								                Eachsampletime = {}

								                timess = times[i].split(',')

								                Eachsampletime["StartingTime"] = timess[0]

								                Eachsampletime["TerminalTime"] = timess[1]

								                SamplingTimePeriods.append(Eachsampletime)

								        except KeyError:

								            SamplingTimePeriods = [{"StartingTime": item["st"],

								                                    "TerminalTime": item["et"]} for item in res["trainTime"]]

								        model = res["para"]["Model_info"]

								        condition = info["condition"].replace("=", "==").replace(">=", ">").replace("<=", "<")

								        dead = info["dead"].split(',')

								        limit = info["limit"].split(',')

								        uplower = info["uplow"].split(';')

								        count = 0

								        Constraint = ""

								        for i in range(len(points)):

								            iteminfo = {}

								            iteminfo["ItemName"] = points[i]  # 加点

								            if dead[i] == "1":  # 判断是否参与死区清洗

								                iteminfo["ClearDeadZone"] = "true"

								            else:

								                iteminfo["ClearDeadZone"] = "false"

								            if limit[i] == "1":  # 参与上下限清�?

								                limits = uplower[i].split(',')

								                if isnumber(limits):  # 输入上下限正�?

								                    count += 1

								                    Constraint += "[" + points[i] + "]>" + limits[0] + " and " + "[" + points[i] + "]<" + limits[

								                        1] + " and "

								            ItemsInfo.append(iteminfo)

								        if count != 0:

								            Constraint = Constraint[:len(Constraint) - 4:]

								        else:

								            Constraint = "1==1"  # 没有上下限清�?

								        Constraint += " and (" + condition + ")"

								        Constraint = Constraint.replace("\n", " ")

								        url = f"http://{config._CLEAN_IP}/exawebapi/exatime/GetCleaningData?ItemsInfo=%s&SamplingTimePeriods=%s&Constraint=%s&SamplingPeriod=%s&DCount=6" % (

								            ItemsInfo, SamplingTimePeriods, Constraint, interval)

								        response = requests.get(url)

								        content = json.loads(response.text)

								        data = np.array([item for item in content["ClearData"]]).T  # test data

								        time_data = np.array([item for item in content["TimeData"]]).reshape(data.shape[0], -1)

								        test_type = info["Test_Type"]

								        limit_value = info["Limit_Value"]

								        number_sample = info["number_sample"]

								        try:

								            expand = info["expand"]

								            # sort_data = info["sort_data"]

								        except KeyError:

								            expand = True

								            # sort_data = True

								        spe_recon = False

								        far, fdr, amplitude = [], [], []

								        recon = []

								        result = {}

								        for _, ass in enumerate(info["assess"]):

								            number_fault_variable = ass["number_fault_variable"]

								            low_f = [float(item) for item in ass["low_f"].split(',')]

								            high_f = [float(item) for item in ass["high_f"].split(',')]

								            result_temp = pca(model, lock, data, number_sample, number_fault_variable, low_f, high_f, test_type,

								                         limit_value, time_data, spe_recon, expand)

								            t_index = np.nonzero(high_f)[0][0]#索引high_f中第一个非0数位置的行数；在矩阵的第3行，t_index == 2

								            far.append(result_temp["far_variable"][t_index])

								            fdr.append(result_temp["fdr_variable"][t_index])

								            recon.append(result_temp["Reconstruction_precision"][t_index])

								            amplitude.append(high_f[t_index])

								        try:

								            index = Test_Data["time"].index(",")

								            result["time"] = Test_Data["time"][:index:]

								        except KeyError:

								            result["time"] = sorted(res["trainTime"], key=lambda item: item["st"])[0]["st"]

								        result["BeforeCleanSamNum"] = content["BeforeCleanSamNum"]

								        result["AfterCleanSamNum"] = content["AfterCleanSamNum"]

								        result["amplitude"] = amplitude

								        result["CleanOrNot"] = True

								        result["far_variable"] = far

								        result["fdr_variable"] = fdr

								        result["Reconstruction_precision"] = recon

								        return result

								    except Exception as e:

								        msg = traceback.format_exc()

								        result = [{"CleanOrNot": False, 'msg': msg}]

								    return result  #


								if __name__ == "__main__":

								    info_str = {"expand":False,"Test_Data":{"time":"2021-07-14 15:41:04,2021-07-15 15:41:04","points":"DH4_40LCA30CT304,DH4_40LCA30CT303,DH4_40LCA10CT301,DH4_40LCJ50CT301,DH4_40LCA30CT305,DH4_40LCJ50AA101GT,DH4_40LCJ60CT301,DH4_40LCA70CT301,DH4_40LCA70CT302","interval":300000},"dead":"1,1,1,1,1,1,1,1,1","limit":"0,0,0,0,0,0,0,0,0","Model_id":"292","Model_alg":"PCA","number_sample":5000,"assess":[{"number_fault_variable":1,"low_f":"3.31,0,0,0,0,0,0,0,0","high_f":"3.31,0,0,0,0,0,0,0,0"},{"number_fault_variable":1,"low_f":"0,2.78,0,0,0,0,0,0,0","high_f":"0,2.78,0,0,0,0,0,0,0"},{"number_fault_variable":1,"low_f":"0,0,3.34,0,0,0,0,0,0","high_f":"0,0,3.34,0,0,0,0,0,0"},{"number_fault_variable":1,"low_f":"0,0,0,3.44,0,0,0,0,0","high_f":"0,0,0,3.44,0,0,0,0,0"},{"number_fault_variable":1,"low_f":"0,0,0,0,3.54,0,0,0,0","high_f":"0,0,0,0,3.54,0,0,0,0"},{"number_fault_variable":1,"low_f":"0,0,0,0,0,4.08,0,0,0","high_f":"0,0,0,0,0,4.08,0,0,0"},{"number_fault_variable":1,"low_f":"0,0,0,0,0,0,3.31,0,0","high_f":"0,0,0,0,0,0,3.31,0,0"},{"number_fault_variable":1,"low_f":"0,0,0,0,0,0,0,2.75,0","high_f":"0,0,0,0,0,0,0,2.75,0"},{"number_fault_variable":1,"low_f":"0,0,0,0,0,0,0,0,3.05","high_f":"0,0,0,0,0,0,0,0,3.05"}],"condition":"[DH4_40DEH-01FU101]>300 and [DH4_40DEH-01FU101]<600 ","Test_Type":"FAI","Limit_Value":1.359,"uplow":"null,null;null,null;null,null;null,null;null,null;null,null;null,null;null,null;null,null","number":0,"version":"v-2020-09-03 18:03:22"}

								    res = main(info_str)

								    print("aaa")