Почему эти почти идентичные функции работают по -разному? - Цифровое Кемерово

Почему эти почти идентичные функции работают по -разному? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Почему эти почти идентичные функции работают по -разному?

Цитата

Сообщение Anonymous » 12 апр 2025, 12:55

Я написал четыре функции, которые изменяют квадратный 2D -массив на месте, он отражает половину от квадратной массивы, разграниченной двумя сторонами, которые встречаются, и соответствующие диагонали 45 градусов, на другую половину, разделенную одной и той же диагональю. Product (('lower', 'Upper'), ('right', 'left')) .
Они используют Numba для компиляции справедливого времени, и они параллелизируются с использованием numba.prange и, следовательно, намного быстрее, чем методы, предоставляемые Numpy:

In [2]: sqr = np.random.randint(0, 256, (1000, 1000), dtype=np.uint8)

In [3]: %timeit x, y = np.tril_indices(1000); sqr[x, y] = sqr[y, x]
9.16 ms ± 30.9 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)
< /code>
Как видите, приведенный выше код занимает очень много времени для выполнения. < /p>

Код: Выделить всё

import numpy as np
import numba as nb

@nb.njit(cache=True, parallel=True, nogil=True)
def triangle_flip_LL2UR(arr: np.ndarray) -> None:
height, width = arr.shape[:2]
if height != width:
raise ValueError("argument arr must be a square")

for i in nb.prange(height):
arr[i, i:] = arr[i:, i]

@nb.njit(cache=True, parallel=True, nogil=True)
def triangle_flip_UR2LL(arr: np.ndarray) -> None:
height, width = arr.shape[:2]
if height != width:
raise ValueError("argument arr must be a square")

for i in nb.prange(height):
arr[i:, i] = arr[i, i:]

@nb.njit(cache=True, parallel=True, nogil=True)
def triangle_flip_LR2UL(arr: np.ndarray) -> None:
height, width = arr.shape[:2]
if height != width:
raise ValueError("argument arr must be a square")

last = height - 1
for i in nb.prange(height):
arr[i, last - i :: -1] = arr[i:, last - i]

@nb.njit(cache=True, parallel=True, nogil=True)
def triangle_flip_UL2LR(arr: np.ndarray) -> None:
height, width = arr.shape[:2]
if height != width:
raise ValueError("argument arr must be a square")

last = height - 1
for i in nb.prange(height):
arr[i:, last - i] = arr[i, last - i :: -1]
< /code>
In [4]: triangle_flip_LL2UR(sqr)

In [5]: triangle_flip_UR2LL(sqr)

In [6]: triangle_flip_LR2UL(sqr)

In [7]: triangle_flip_UL2LR(sqr)

In [8]: %timeit triangle_flip_LL2UR(sqr)
194 μs ± 634 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)

In [9]: %timeit triangle_flip_UR2LL(sqr)
488 μs ± 3.26 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)

In [10]: %timeit triangle_flip_LR2UL(sqr)
196 μs ± 501 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)

In [11]: %timeit triangle_flip_UL2LR(sqr)
486 μs ± 855 ns per loop (mean ± std. dev. of 7 runs, 1,000 loops each)
< /code>
Почему у них есть время выполнения со значительной разницей? Двое из них требуют около 200 микросекундов для выполнения, два других около 500 микросекунд, несмотря на то, что они почти идентичны. < /P>

Я что -то обнаружил. triangle_flip_ur2ll (arr)

то же самое, что и triangle_flip_ll2ur (sqr.t) и наоборот.

Код: Выделить всё

In [109]: %timeit triangle_flip_UR2LL(sqr.T)
196 μs ± 1.15 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)

In [110]: %timeit triangle_flip_LL2UR(sqr.T)
490 μs ± 1.24 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)

Почему это происходит?

Подробнее здесь: https://stackoverflow.com/questions/795 ... ifferently

Реклама

1744451702

Anonymous

 Я написал четыре функции, которые изменяют квадратный 2D -массив на месте, он отражает половину от квадратной массивы, разграниченной двумя сторонами, которые встречаются, и соответствующие диагонали 45 градусов, на другую половину, разделенную одной и той же диагональю. Product (('lower', 'Upper'), ('right', 'left')) . 
Они используют Numba для компиляции справедливого времени, и они параллелизируются с использованием numba.prange  и, следовательно, намного быстрее, чем методы, предоставляемые Numpy: 

In [2]: sqr = np.random.randint(0, 256, (1000, 1000), dtype=np.uint8)

In [3]: %timeit x, y = np.tril_indices(1000); sqr[x, y] = sqr[y, x]
9.16 ms ± 30.9 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)
< /code>
Как видите, приведенный выше код занимает очень много времени для выполнения. < /p>
[code]import numpy as np
import numba as nb

@nb.njit(cache=True, parallel=True, nogil=True)
def triangle_flip_LL2UR(arr: np.ndarray) -> None:
height, width = arr.shape[:2]
if height != width:
raise ValueError("argument arr must be a square")

for i in nb.prange(height):
arr[i, i:] = arr[i:, i]

@nb.njit(cache=True, parallel=True, nogil=True)
def triangle_flip_UR2LL(arr: np.ndarray) -> None:
height, width = arr.shape[:2]
if height != width:
raise ValueError("argument arr must be a square")

for i in nb.prange(height):
arr[i:, i] = arr[i, i:]

@nb.njit(cache=True, parallel=True, nogil=True)
def triangle_flip_LR2UL(arr: np.ndarray) -> None:
height, width = arr.shape[:2]
if height != width:
raise ValueError("argument arr must be a square")

last = height - 1
for i in nb.prange(height):
arr[i, last - i :: -1] = arr[i:, last - i]

@nb.njit(cache=True, parallel=True, nogil=True)
def triangle_flip_UL2LR(arr: np.ndarray) -> None:
height, width = arr.shape[:2]
if height != width:
raise ValueError("argument arr must be a square")

last = height - 1
for i in nb.prange(height):
arr[i:, last - i] = arr[i, last - i :: -1]
< /code>
In [4]: triangle_flip_LL2UR(sqr)

In [5]: triangle_flip_UR2LL(sqr)

In [6]: triangle_flip_LR2UL(sqr)

In [7]: triangle_flip_UL2LR(sqr)

In [8]: %timeit triangle_flip_LL2UR(sqr)
194 μs ± 634 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)

In [9]: %timeit triangle_flip_UR2LL(sqr)
488 μs ± 3.26 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)

In [10]: %timeit triangle_flip_LR2UL(sqr)
196 μs ± 501 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)

In [11]: %timeit triangle_flip_UL2LR(sqr)
486 μs ± 855 ns per loop (mean ± std. dev. of 7 runs, 1,000 loops each)
< /code>
Почему у них есть время выполнения со значительной разницей? Двое из них требуют около 200 микросекундов для выполнения, два других около 500 микросекунд, несмотря на то, что они почти идентичны. < /P>

Я что -то обнаружил. triangle_flip_ur2ll (arr) [/code] то же самое, что и triangle_flip_ll2ur (sqr.t)  и наоборот.[code]In [109]: %timeit triangle_flip_UR2LL(sqr.T)
196 μs ± 1.15 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)

In [110]: %timeit triangle_flip_LL2UR(sqr.T)
490 μs ± 1.24 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)
[/code]
Почему это происходит? 
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79570163/why-do-these-nearly-identical-functions-perform-very-differently[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Две почти идентичные страницы HTML/CSS воспроизводят по -разному

Последнее сообщение Anonymous « 18 май 2025, 21:15
Добавлено в форуме Php

Anonymous » 18 май 2025, 21:15 » в форуме Php

hi,
Я модернизирую веб-страницу PHP 5 на PHP 8. Как часть обновления, я также переключаю кодирование символов с charset = iso-8859-1 на charset = utf-8 , и преобразовал файлы в UTF-8 без Bom. Преобразование, конвертированная страница по какой -то...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
18 май 2025, 21:15
Две почти идентичные страницы HTML/CSS воспроизводят по -разному

Последнее сообщение Anonymous « 18 май 2025, 21:15
Добавлено в форуме Html

Anonymous » 18 май 2025, 21:15 » в форуме Html

hi,
Я модернизирую веб-страницу PHP 5 на PHP 8. Как часть обновления, я также переключаю кодирование символов с charset = iso-8859-1 на charset = utf-8 , и преобразовал файлы в UTF-8 без Bom. Преобразование, конвертированная страница по какой -то...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
18 май 2025, 21:15
Две почти идентичные страницы HTML/CSS воспроизводят по -разному

Последнее сообщение Anonymous « 18 май 2025, 21:15
Добавлено в форуме CSS

Anonymous » 18 май 2025, 21:15 » в форуме CSS

hi,
Я модернизирую веб-страницу PHP 5 на PHP 8. Как часть обновления, я также переключаю кодирование символов с charset = iso-8859-1 на charset = utf-8 , и преобразовал файлы в UTF-8 без Bom. Преобразование, конвертированная страница по какой -то...

0 Ответы

60 Просмотры

Последнее сообщение Anonymous
18 май 2025, 21:15
Идентичные таблицы MySQL работают по -разному

Последнее сообщение Anonymous « 24 июл 2025, 16:16
Добавлено в форуме MySql

Anonymous » 24 июл 2025, 16:16 » в форуме MySql

Итак, у меня есть 2 базы данных MySQL на том же сервере. Both of these databases are identical in terms of tables and structure.
However we are finding that querying one of these databases (in particular a certain table) is far slower than querying...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
24 июл 2025, 16:16
Почему значения сумм PHP по -разному по -разному? [дублировать]

Последнее сообщение Anonymous « 23 фев 2025, 00:48
Добавлено в форуме Php

Anonymous » 23 фев 2025, 00:48 » в форуме Php

laravel 8, php 8
Я видел очень странную вещь в Ларавеле и на самом деле в PHP, что я не могу понять, почему это происходит в php.
У меня есть два массива, которые почти идентичны и имеют только одну очень маленькую разницу. И результат работы...

0 Ответы

51 Просмотры

Последнее сообщение Anonymous
23 фев 2025, 00:48

Вернуться в «Python»

Programmiererforum