Просто любопытно, если вариант (b) более эффективен, чем вариант (а)? На первый взгляд, вариант (а) будет иметь несколько раз больше операций, чем вариант (b). Но я сделал несколько симуляций для миллиона рядов в df , вариант (b) в среднем всего на чем -то быстрее. Означает ли это, что панды будут сгруппировать все скалярные операции в опцию (а) автоматически? p>
df['val2'] = (a*b+c*d)*df['val1']*e/f
< /code>
(b) < /p>
x = (a*b+c*d)*e/f
df['val2'] = df['val1']*x
Подробнее здесь: https://stackoverflow.com/questions/794 ... taframe-co
Должны ли мы предварительно рассчитывать скалярные вычисления, прежде чем применим их к столбцам DataFrame? ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение