Когда я должен предпочесть, сконструированную с помощью записи, спланированную CUDA, отображенную память хоста? - Цифровое Кемерово

Когда я должен предпочесть, сконструированную с помощью записи, спланированную CUDA, отображенную память хоста? ⇐ C++

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Когда я должен предпочесть, сконструированную с помощью записи, спланированную CUDA, отображенную память хоста?

Цитата

Сообщение Anonymous » 24 апр 2025, 09:07

Cudahostalloc () < /code> API -вызов API имеет, среди прочего, флаги: < /p>

cudahostallocmapped: отображает распределение в адресное пространство CUDA. Указатель устройства на память может быть получен путем вызова cudahostgetdevicepointer (). < /Li>
cudahostallocwritecombined: выделяет память как скольжение с записи (WC). Память WC может быть передана по всей шине PCI Express быстрее в некоторых системных конфигурациях, , но не может быть эффективно чтение по большинству процессоров. Память WC является хорошим вариантом для буферов, которые будут записаны процессором и прочитаны устройством с помощью отображенной закрепленной памяти или передачи устройства HOST->. Я имею в виду, что это не сказал, что передача может быть быстрее только в одном направлении, так почему они рекомендуют его только для одного направления? Кроме того, какие системы извлекают выгоду из этого «сцепления с записи»? Хорошо, поэтому чтение по процессору неэффективно; Но что, если другие преимущества компенсируют эту неэффективность? Или - если они не могут, почему они не могут?
Объяснение будет оценено.

Подробнее здесь: https://stackoverflow.com/questions/359 ... ost-memory

1745474836

Anonymous

 Cudahostalloc () < /code> API -вызов API имеет, среди прочего, флаги: < /p>


 cudahostallocmapped: отображает распределение в адресное пространство CUDA. Указатель устройства на память может быть получен путем вызова cudahostgetdevicepointer (). < /Li>
 cudahostallocwritecombined: выделяет память как скольжение с записи (WC). Память WC может быть передана по всей шине PCI Express быстрее [b] в некоторых системных конфигурациях, [/b], но не может быть эффективно чтение по большинству процессоров. Память WC является хорошим вариантом для буферов, которые будут записаны процессором и прочитаны устройством с помощью отображенной закрепленной памяти или передачи устройства HOST->. Я имею в виду, что это не сказал, что передача может быть быстрее только в одном направлении, так почему они рекомендуют его только для одного направления? Кроме того, какие системы извлекают выгоду из этого «сцепления с записи»? Хорошо, поэтому чтение по процессору неэффективно; Но что, если другие преимущества компенсируют эту неэффективность? Или - если они не могут, почему они не могут? 
Объяснение будет оценено. 

Подробнее здесь: [url]https://stackoverflow.com/questions/35977061/when-should-i-prefer-write-combined-cuda-allocated-mapped-host-memory[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «C++»