hace 2 años · 834e0e0759
--- a/etl/base/WindFarms.py
+++ b/etl/base/WindFarms.py
@@ -270,6 +270,7 @@ class WindFarms(object):
 
				         #     exec_str = f"df['wind_turbine_number'].apply(lambda wind_name: {self.trans_param.wind_name_exec} )"
			
 
				         # df['wind_turbine_number'] = eval(exec_str)
			
 
				         df['wind_turbine_number'] = df['wind_turbine_number'].astype('str')
			
 
				+        df['wind_turbine_name'] = df['wind_turbine_number']
			
 
				         df['wind_turbine_number'] = df['wind_turbine_number'].map(
			
 
				             self.wind_col_trans).fillna(
			
 
				             df['wind_turbine_number'])
			
--- a/qinghai-nuomuhong.py
+++ b/qinghai-nuomuhong.py
@@ -0,0 +1,162 @@
 
				+# -*- coding: utf-8 -*-
			
 
				+"""
			
 
				+Spyder 编辑器
			
 
				+
			
 
				+这是一个临时脚本文件。
			
 
				+"""
			
 
				+import copy
			
 
				+import datetime
			
 
				+import multiprocessing
			
 
				+import os
			
 
				+
			
 
				+import pandas as pd
			
 
				+import numpy as np
			
 
				+
			
 
				+dianjian_str = """
			
 
				+wind_turbine_number		
			
 
				+time_stamp		时间
			
 
				+active_power		有功功率 kW
			
 
				+rotor_speed		风轮转速 rpm
			
 
				+generator_speed		发电机转速 rpm
			
 
				+wind_velocity		风速 m/s
			
 
				+pitch_angle_blade_1		叶片1角度 °
			
 
				+pitch_angle_blade_2		叶片2角度 °
			
 
				+pitch_angle_blade_3		叶片3角度 °
			
 
				+cabin_position		机舱位置 °
			
 
				+true_wind_direction		
			
 
				+yaw_error1		风向 °
			
 
				+twisted_cable_angle		
			
 
				+main_bearing_temperature		主轴温度 ℃
			
 
				+gearbox_oil_temperature		齿轮箱温度 ℃
			
 
				+gearbox_low_speed_shaft_bearing_temperature		齿轮箱轴承温度 ℃
			
 
				+gearboxmedium_speed_shaftbearing_temperature		
			
 
				+gearbox_high_speed_shaft_bearing_temperature		齿轮箱轴承温度2 ℃
			
 
				+generatordrive_end_bearing_temperature		发电机驱动侧轴承温度 ℃
			
 
				+generatornon_drive_end_bearing_temperature		发电机非驱动侧轴承温度 ℃
			
 
				+cabin_temperature		机舱温度 ℃
			
 
				+outside_cabin_temperature		舱外温度 ℃
			
 
				+generator_winding1_temperature		
			
 
				+generator_winding2_temperature		
			
 
				+generator_winding3_temperature		
			
 
				+front_back_vibration_of_the_cabin		
			
 
				+side_to_side_vibration_of_the_cabin		
			
 
				+required_gearbox_speed		
			
 
				+inverter_speed_master_control		
			
 
				+actual_torque		
			
 
				+given_torque		
			
 
				+clockwise_yaw_count		
			
 
				+counterclockwise_yaw_count		
			
 
				+unusable		
			
 
				+power_curve_available		
			
 
				+set_value_of_active_power		有功功率设定 kW
			
 
				+wind_turbine_status		
			
 
				+wind_turbine_status2		
			
 
				+turbulence_intensity		
			
 
				+"""
			
 
				+
			
 
				+datas = [i for i in dianjian_str.split("\n") if i]
			
 
				+
			
 
				+dianjian_dict = dict()
			
 
				+
			
 
				+for data in datas:
			
 
				+    ds = data.split("\t")
			
 
				+
			
 
				+    if len(ds) == 3:
			
 
				+        dianjian_dict[ds[0]] = ds[2]
			
 
				+    else:
			
 
				+        dianjian_dict[ds[0]] = ''
			
 
				+
			
 
				+
			
 
				+def read_df(file_path):
			
 
				+    df = pd.read_csv(file_path, header=[0, 1])
			
 
				+
			
 
				+    col_nams_map = dict()
			
 
				+    pre_col = ""
			
 
				+    for tuple_col in df.columns:
			
 
				+        col1 = tuple_col[0]
			
 
				+        col2 = tuple_col[1]
			
 
				+        if str(col1).startswith("Unnamed"):
			
 
				+            if pre_col:
			
 
				+                col1 = pre_col
			
 
				+                pre_col = ''
			
 
				+            else:
			
 
				+                col1 = ''
			
 
				+        else:
			
 
				+            pre_col = col1
			
 
				+
			
 
				+        if str(col2).startswith("Unnamed"):
			
 
				+            col2 = ''
			
 
				+
			
 
				+        col_nams_map[str(tuple_col)] = ''.join([col1, col2])
			
 
				+
			
 
				+    for k, v in col_nams_map.items():
			
 
				+        if str(v).endswith('均值'):
			
 
				+            col_nams_map[k] = str(v)[:-2]
			
 
				+
			
 
				+    df.columns = [str(col) for col in df.columns]
			
 
				+    df.rename(columns=col_nams_map, inplace=True)
			
 
				+
			
 
				+    for col, name in dianjian_dict.items():
			
 
				+        if name in df.columns:
			
 
				+            df.rename(columns={name: col}, inplace=True)
			
 
				+
			
 
				+    for col in df.columns:
			
 
				+        if col not in dianjian_dict.keys():
			
 
				+            del df[col]
			
 
				+
			
 
				+    return df
			
 
				+
			
 
				+
			
 
				+def get_wind_name_files(path):
			
 
				+    files = os.listdir(path)
			
 
				+
			
 
				+    wind_files_map = dict()
			
 
				+    for file in files:
			
 
				+        full_file = os.path.join(path, file)
			
 
				+        file_datas = str(file).split("@")
			
 
				+        key = file_datas[0].replace("HD", "HD2")
			
 
				+        if key in wind_files_map.keys():
			
 
				+            wind_files_map[key].append(full_file)
			
 
				+        else:
			
 
				+            wind_files_map[key] = [full_file]
			
 
				+
			
 
				+    return wind_files_map
			
 
				+
			
 
				+
			
 
				+def combine_df(save_path, wind_name, files):
			
 
				+    begin = datetime.datetime.now()
			
 
				+    df = pd.DataFrame()
			
 
				+    for file in files:
			
 
				+        query_df = read_df(file)
			
 
				+        print("读取", file, query_df.shape)
			
 
				+        query_df['time_stamp'] = pd.to_datetime(query_df['time_stamp'])
			
 
				+        query_df.set_index(keys='time_stamp', inplace=True)
			
 
				+        query_df = query_df[~query_df.index.duplicated(keep='first')]
			
 
				+        if df.empty:
			
 
				+            df = copy.deepcopy(query_df)
			
 
				+        else:
			
 
				+            df = pd.concat([df, query_df], axis=1, join='inner')
			
 
				+    df.reset_index(inplace=True)
			
 
				+    df['wind_turbine_number'] = wind_name
			
 
				+    for col, name in dianjian_dict.items():
			
 
				+        if col not in df.columns:
			
 
				+            df[col] = np.nan
			
 
				+
			
 
				+    df = df[dianjian_dict.keys()]
			
 
				+    df.to_csv(os.path.join(save_path, wind_name + ".csv"), encoding='utf-8', index=False)
			
 
				+
			
 
				+    print(wind_name, '整理完成', '耗时:', (datetime.datetime.now() - begin).seconds)
			
 
				+
			
 
				+
			
 
				+if __name__ == '__main__':
			
 
				+    read_path = r'/data/download/collection_data/1进行中/诺木洪风电场-甘肃-华电/收资数据/sec'
			
 
				+    save_path = r'/data/download/collection_data/1进行中/诺木洪风电场-甘肃-华电/清理数据/sec'
			
 
				+
			
 
				+    # read_path = r'D:\trans_data\诺木洪\收资数据\min'
			
 
				+    # save_path = r'D:\trans_data\诺木洪\清理数据\min'
			
 
				+    if not os.path.exists(save_path):
			
 
				+        os.makedirs(save_path, exist_ok=True)
			
 
				+    wind_files_map = get_wind_name_files(read_path)
			
 
				+
			
 
				+    with multiprocessing.Pool(6) as pool:
			
 
				+        pool.starmap(combine_df, [(save_path, wind_name, files) for wind_name, files in wind_files_map.items()])
			
--- a/service/plt_service.py
+++ b/service/plt_service.py
@@ -36,8 +36,7 @@ def update_trans_status_success(batch_no, trans_type, wind_count=0, time_granula
 
				 def update_trans_transfer_progress(batch_no, trans_type, transfer_progress=0, save_db=True):
			
 
				     if save_db:
			
 
				         exec_sql = """
			
 
				-        update data_transfer set transfer_progress =%s,transfer_finish_time=now()  
			
 
				-        where batch_code = %s  and transfer_type = %s
			
 
				+        update data_transfer set transfer_progress =%s where batch_code = %s  and transfer_type = %s
			
 
				         """
			
 
				         plt.execute(exec_sql, (transfer_progress, batch_no, trans_type))
			
 
				 
			
--- a/service/trans_service.py
+++ b/service/trans_service.py
@@ -33,6 +33,7 @@ def creat_table_and_add_partition(table_name, count, read_type):
 
				     CREATE TABLE
			
 
				     IF NOT EXISTS `{table_name}` (
			
 
				         `wind_turbine_number` VARCHAR (20) DEFAULT NULL COMMENT '风机编号',
			
 
				+        `wind_turbine_name` VARCHAR(20) DEFAULT NULL COMMENT '风机原始名称',
			
 
				         `time_stamp` datetime NOT NULL COMMENT '时间戳',
			
 
				         `active_power` DOUBLE DEFAULT NULL COMMENT '有功功率',
			
 
				         `rotor_speed` DOUBLE DEFAULT NULL COMMENT '风轮转速',