Как суммировать значения на основе второго индексного массива векторизованным способомPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как суммировать значения на основе второго индексного массива векторизованным способом

Сообщение Anonymous »

Предположим, у меня есть массив значений
values = np.array([0.0, 1.0, 2.0, 3.0, 4.0])

и индексный массив
indices = np.array([0,1,0,2,2])

Существует ли векторизованный способ суммирования значений для каждого уникального индекса в индексах?
Я имею в виду векторизованную версию для получения сумм в этом фрагменте :
sums = np.zeros(np.max(indices)+1)
for index, value in zip(indices, values):
sums[index] += value

Бонусные баллы, если решение позволяет значениям (и, как следствие, суммам) быть многомерными.
РЕДАКТИРОВАТЬ: Я сравнил опубликованные решения:
import numpy as np
import time
import pandas as pd

values = np.arange(1_000_000, dtype=float)
rng = np.random.default_rng(0)
indices = rng.integers(0, 1000, size=1_000_000)

N = 100

now = time.time_ns()
for _ in range(N):
sums = np.bincount(indices, weights=values, minlength=1000)
print(f"np.bincount: {(time.time_ns() - now) * 1e-6 / N:.3f} ms")

now = time.time_ns()
for _ in range(N):
sums = np.zeros(1 + np.amax(indices), dtype=values.dtype)
np.add.at(sums, indices, values)
print(f"np.add.at: {(time.time_ns() - now) * 1e-6 / N:.3f} ms")

now = time.time_ns()
for _ in range(N):
pd.Series(values).groupby(indices).sum().values
print(f"pd.groupby: {(time.time_ns() - now) * 1e-6 / N:.3f} ms")

now = time.time_ns()
for _ in range(N):
sums = np.zeros(np.max(indices)+1)
for index, value in zip(indices, values):
sums[index] += value
print(f"Loop: {(time.time_ns() - now) * 1e-6 / N:.3f} ms")

Результаты:
np.bincount: 1.129 ms
np.add.at: 0.763 ms
pd.groupby: 5.215 ms
Loop: 196.633 ms


Подробнее здесь: https://stackoverflow.com/questions/791 ... zed-manner
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»