Предположим, у меня есть массив значений
values = np.array([0.0, 1.0, 2.0, 3.0, 4.0])
и индексный массив
indices = np.array([0,1,0,2,2])
Существует ли векторизованный способ суммирования значений для каждого уникального индекса в индексах?
Я имею в виду векторизованную версию для получения сумм в этом фрагменте :
sums = np.zeros(np.max(indices)+1)
for index, value in zip(indices, values):
sums[index] += value
Бонусные баллы, если решение позволяет значениям (и, как следствие, суммам) быть многомерными.
РЕДАКТИРОВАТЬ: Я сравнил опубликованные решения:
import numpy as np
import time
import pandas as pd
values = np.arange(1_000_000, dtype=float)
rng = np.random.default_rng(0)
indices = rng.integers(0, 1000, size=1_000_000)
N = 100
now = time.time_ns()
for _ in range(N):
sums = np.bincount(indices, weights=values, minlength=1000)
print(f"np.bincount: {(time.time_ns() - now) * 1e-6 / N:.3f} ms")
now = time.time_ns()
for _ in range(N):
sums = np.zeros(1 + np.amax(indices), dtype=values.dtype)
np.add.at(sums, indices, values)
print(f"np.add.at: {(time.time_ns() - now) * 1e-6 / N:.3f} ms")
now = time.time_ns()
for _ in range(N):
pd.Series(values).groupby(indices).sum().values
print(f"pd.groupby: {(time.time_ns() - now) * 1e-6 / N:.3f} ms")
now = time.time_ns()
for _ in range(N):
sums = np.zeros(np.max(indices)+1)
for index, value in zip(indices, values):
sums[index] += value
print(f"Loop: {(time.time_ns() - now) * 1e-6 / N:.3f} ms")
Результаты:
np.bincount: 1.129 ms
np.add.at: 0.763 ms
pd.groupby: 5.215 ms
Loop: 196.633 ms
Подробнее здесь: https://stackoverflow.com/questions/791 ... zed-manner
Как суммировать значения на основе второго индексного массива векторизованным способом ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Как суммировать значения на основе второго индексного массива векторизованным способом
Anonymous » » в форуме Python - 0 Ответы
- 13 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Как суммировать значения на основе второго индексного массива векторизованным способом
Anonymous » » в форуме Python - 0 Ответы
- 15 Просмотры
-
Последнее сообщение Anonymous
-