У меня есть большой набор данных, примерно 100 тысяч или 1 миллион строк, и у меня есть функция, которая выполняет векторные вычисления, которые занимают 0,03 секунды, теперь все мои столбцы, прежде чем процесс, могут быть одинаковыми для каждой итерации. Я хочу вычислить 2^n комбинаций условий, которые я создаю. Итак, в настоящее время мне потребуется 2^n * 0,03 с, чтобы запустить все это по длине цикла и запустить функцию. Есть ли лучший способ повысить производительность и запустить все эти возможности векторизованно или параллельно (не параллельно с процессором Python, это немного помогает) единственное, о чем я думаю, это создать уникальный столбец для каждой итерации и выполнить вычисления регулярных выражений, но тогда df будет слишком большим
Подробнее здесь: https://stackoverflow.com/questions/789 ... mbinations
Панды Python повторяют огромное количество комбинаций [закрыто] ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение