С прошлой недели мы наблюдаем значительный всплеск загрузки ЦП, причина была идентифицирована как процесс Python.
После устранения неполадок мы определили, что причиной проблемы является модель ADTK. Мы используем другие модели машинного обучения, такие как IForest, ECOD, CBLOF и т. д. Но за этот всплеск ответственен только ADTK.
Для справки найдите текущий код модели:
Код: Выделить всё
data=df.copy()
minutes = 300
df['predict_dt']=pd.to_datetime(df['predict_dt'])
df = df.set_index(['predict_dt']).sort_index()
seasonal_vol = SeasonalAD(c=1.6,side='negative',trend=True)
seasonal_vol.fit(df['predict_count'])
df['anomalies']=seasonal_vol.predict(df['predict_count'])
df2 = pd.DataFrame(columns=['predict_dt', 'hour', 'min','predict_count','label'])
final = datetime.datetime.now(pytz.timezone('America/Los_Angeles')).replace(tzinfo=None)-timedelta(minutes=minutes)
for i in range(len(df)):
if(data['predict_dt'][i] >= final):
if str(df['anomalies'][i]).lower() == "true":
#calling SP for further operation
Подробнее здесь: https://stackoverflow.com/questions/792 ... g-high-cpu