Как создать логическую комбинацию метрик в Python ⇐ Python
-
Гость
Как создать логическую комбинацию метрик в Python
Я работал в отделе по борьбе с мошенничеством, и в основном наша задача — создать модель (не машинное обучение) для проверки или обнаружения поведения мошенников, например, метрику с логикой. Иногда производительность метрик снижается из-за изменения поведения мошенников, поэтому нам приходится искать новые функции и параметры (или даже новые метрики), чтобы повысить производительность. Проблема в том, что делать это с помощью Excel или электронных таблиц неэффективно. Вам нужно найти процентильное распределение, найти порог вручную, вычислить матрицу путаницы (TP, FP, Recall и т. д.) и найти комбинацию каждого признака вручную, что никогда не делается должным образом (если у нас есть 10 признаков, невозможно объединить все эти функции в Excel).
Итак, как это сделать на Python? AFAIK, у них есть функция смущения_matrix при обучении scikit, но это для машинного обучения. Я не знаю, есть ли у панд такая функция. Я просто хочу автоматически объединить все функции и посмотреть производительность (напомнимость, точность) для каждой комбинации? Является ли это возможным? Спасибо.
Вам нужно найти процентильное распределение, найти порог вручную, вычислить матрицу путаницы (TP, FP, Recall и т. д.) и найти комбинацию каждого признака вручную, что никогда не делается должным образом (если у нас есть 10 функций, в Excel невозможно совместить все эти функции).
Итак, как это сделать на Python? AFAIK, у них есть функция смущения_matrix при обучении scikit, но это для машинного обучения. Я не знаю, есть ли у панд такая функция. Я просто хочу автоматически объединить все функции и посмотреть производительность (напомнимость, точность) для каждой комбинации? Является ли это возможным? Спасибо.
Я работал в отделе по борьбе с мошенничеством, и в основном наша задача — создать модель (не машинное обучение) для проверки или обнаружения поведения мошенников, например, метрику с логикой. Иногда производительность метрик снижается из-за изменения поведения мошенников, поэтому нам приходится искать новые функции и параметры (или даже новые метрики), чтобы повысить производительность. Проблема в том, что делать это с помощью Excel или электронных таблиц неэффективно. Вам нужно найти процентильное распределение, найти порог вручную, вычислить матрицу путаницы (TP, FP, Recall и т. д.) и найти комбинацию каждого признака вручную, что никогда не делается должным образом (если у нас есть 10 признаков, невозможно объединить все эти функции в Excel).
Итак, как это сделать на Python? AFAIK, у них есть функция смущения_matrix при обучении scikit, но это для машинного обучения. Я не знаю, есть ли у панд такая функция. Я просто хочу автоматически объединить все функции и посмотреть производительность (напомнимость, точность) для каждой комбинации? Является ли это возможным? Спасибо.
Вам нужно найти процентильное распределение, найти порог вручную, вычислить матрицу путаницы (TP, FP, Recall и т. д.) и найти комбинацию каждого признака вручную, что никогда не делается должным образом (если у нас есть 10 функций, в Excel невозможно совместить все эти функции).
Итак, как это сделать на Python? AFAIK, у них есть функция смущения_matrix при обучении scikit, но это для машинного обучения. Я не знаю, есть ли у панд такая функция. Я просто хочу автоматически объединить все функции и посмотреть производительность (напомнимость, точность) для каждой комбинации? Является ли это возможным? Спасибо.
Мобильная версия