Могу ли я оптимизировать вызов torch::where для быстрого выполнения с помощью других функций? - Цифровое Кемерово

Могу ли я оптимизировать вызов torch::where для быстрого выполнения с помощью других функций? ⇐ C++

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Могу ли я оптимизировать вызов torch::where для быстрого выполнения с помощью других функций?

Цитата

Сообщение Anonymous » 27 янв 2025, 15:28

Сейчас я работаю над проектом, который требует быстрого выполнения и использует много libtorch для необходимых тензорных операций. Во время отладки я заметил, что следующая строка работает очень медленно:

Код: Выделить всё

auto res = torch::where(tensor_A != 0.0, tensor_A - tensor_B, tensor_A);

с tensor_A.sizes() == [1, N, 10, 2], tensor_B.sizes() == [N, 1, 1, 2]< /код>. Очень медленно означает ~15 мс для N=128, что будет максимальным размером N. Как я могу это оптимизировать? Есть ли более быстрая альтернатива с использованием других функций в этом случае приложения?
Заранее спасибо
Я уже пробовал предварительно вычислить условие и вычитание, но получилось не улучшает общую производительность.
Изменить:

Это проект ros2, поэтому я компилирую с использованием сборки colcon и уже включил -03 и -march=native. Я измеряю время с помощью std::chrono::high_solve_lock::now()

Подробнее здесь: https://stackoverflow.com/questions/793 ... -functions

Реклама

1737980930

Anonymous

Сейчас я работаю над проектом, который требует быстрого выполнения и использует много libtorch для необходимых тензорных операций. Во время отладки я заметил, что следующая строка работает очень медленно:
[code]auto res = torch::where(tensor_A != 0.0, tensor_A - tensor_B, tensor_A);
[/code]
с tensor_A.sizes() == [1, N, 10, 2], tensor_B.sizes() == [N, 1, 1, 2]< /код>. Очень медленно означает ~15 мс для N=128, что будет максимальным размером N. Как я могу это оптимизировать? Есть ли более быстрая альтернатива с использованием других функций в этом случае приложения?
Заранее спасибо
Я уже пробовал предварительно вычислить условие и вычитание, но получилось не улучшает общую производительность.
Изменить:

Это проект ros2, поэтому я компилирую с использованием сборки colcon и уже включил -03 и -march=native. Я измеряю время с помощью std::chrono::high_solve_lock::now() 

Подробнее здесь: [url]https://stackoverflow.com/questions/79390776/can-i-optimize-a-torchwhere-call-for-fast-execution-by-using-other-functions[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как я могу оптимизировать код Python для более быстрого выполнения?

Последнее сообщение Anonymous « 07 май 2025, 07:57
Добавлено в форуме Python

Anonymous » 07 май 2025, 07:57 » в форуме Python

Я работаю над приложением обработки данных в Python, где производительность становится узким местом. По мере того, как мой набор данных становится все больше, время выполнения значительно увеличивается, и мне нужно найти способы оптимизировать мой...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
07 май 2025, 07:57
Как я могу оптимизировать код Python для более быстрого выполнения? [закрыто]

Последнее сообщение Anonymous « 07 май 2025, 13:26
Добавлено в форуме Python

Anonymous » 07 май 2025, 13:26 » в форуме Python

Я работаю над приложением обработки данных в Python, где производительность становится узким местом. По мере того, как мой набор данных становится все больше, время выполнения значительно увеличивается, и мне нужно найти способы оптимизировать мой...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
07 май 2025, 13:26
Как я могу оптимизировать код Python для более быстрого выполнения?

Последнее сообщение Anonymous « 17 июн 2025, 16:03
Добавлено в форуме Python

Anonymous » 17 июн 2025, 16:03 » в форуме Python

Я пытаюсь ускорить производительность некоторого кода Python, который обрабатывает большие наборы данных. Вывод правильный, но он слишком медленный. Я был бы признателен за любыми предложениями по оптимизации.def process_data(data):
result = []
for...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
17 июн 2025, 16:03
Я не понимаю поведение torch.Tensor при передаче в него объекта torch.Size.

Последнее сообщение Anonymous « 19 апр 2024, 23:27
Добавлено в форуме Python

Anonymous » 19 апр 2024, 23:27 » в форуме Python

Предыстория
Я пытаюсь придерживаться концепции Torch, чтобы гарантировать, что если структуры данных, с которыми я работаю, находятся в графическом процессоре, то все они находятся в графическом процессоре, и наоборот, чтобы Я не смешиваю...

0 Ответы

88 Просмотры

Последнее сообщение Anonymous
19 апр 2024, 23:27
Torch.optim — AttributeError: частично инициализированный модуль «torch» не имеет атрибута «_jit_internal» (скорее всего

Последнее сообщение Anonymous « 06 окт 2024, 21:05
Добавлено в форуме Python

Anonymous » 06 окт 2024, 21:05 » в форуме Python

В настоящее время на моем компьютере возникла проблема с фонариком.
Когда я запускаю приведенный ниже код,
import torch.nn as nn
import torch.nn.functional as F
import numpy as np
import torch

Это работает, но когда я добавляю «из torch.optim...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
06 окт 2024, 21:05

Вернуться в «C++»

Programmiererforum