Вопрос о dbscan от sklearn и dbscan от Rapids

Вопрос о dbscan от sklearn и dbscan от Rapids ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Вопрос о dbscan от sklearn и dbscan от Rapids

Цитата

Сообщение Anonymous » 16 июл 2024, 14:30

Я тестирую версию Rapids на dbscan, которая работает с графическим процессором.
Я написал короткий код на Python, который находит кластеры в трехмерных случайно сгенерированных точках, и когда я играл с кодом, я понял, что процессор работает неправильно быстрее, чем графический процессор по какой-то причине, с которой я не знаком:
`

Код: Выделить всё

    from sklearn.cluster import DBSCAN
from cuml.cluster import DBSCAN as cuDBSCAN
import cupy as cp

pij_gpu = cp.asarray(pij.astype(np.float32))  # Transfer data to GPU
eps = 0.3
min_samples = 5
start = time.time()
cluster = DBSCAN(eps=eps, min_samples=min_samples, n_jobs=-1)
cluster.fit(pij)
print(f"CPU: {time.time() - start}")

start = time.time()
cluster_gpu = cuDBSCAN(eps=eps, min_samples=min_samples)
cluster_gpu.fit(pij_gpu)
print(f"GPU: {time.time() - start}")

`
журналы:

Код: Выделить всё

size is: (670761, 3)
CPU: 1.508012294769287
[W] [14:24:17.089902] Batch size limited by the chosen integer type (4 bytes). 6007 -> 3201. Using the larger integer type might result in better performance
GPU: 10.168060541152954

я распечатал размер pij.
я что-то упустил?
я поискал в Интернете и использовал чатgpt, чтобы найти ответ, но я не смог найти ответ.
Я заметил одну вещь: когда точки ближе, графический процессор имеет тенденцию работать немного быстрее, чем процессор.
у меня nvidia 3090 и относительно мощный компьютер

Подробнее здесь: https://stackoverflow.com/questions/787 ... rom-rapids

1721129423

Anonymous

Я тестирую версию Rapids на dbscan, которая работает с графическим процессором.
Я написал короткий код на Python, который находит кластеры в трехмерных случайно сгенерированных точках, и когда я играл с кодом, я понял, что процессор работает неправильно быстрее, чем графический процессор по какой-то причине, с которой я не знаком:
`
[code]    from sklearn.cluster import DBSCAN
from cuml.cluster import DBSCAN as cuDBSCAN
import cupy as cp

pij_gpu = cp.asarray(pij.astype(np.float32))  # Transfer data to GPU
eps = 0.3
min_samples = 5
start = time.time()
cluster = DBSCAN(eps=eps, min_samples=min_samples, n_jobs=-1)
cluster.fit(pij)
print(f"CPU: {time.time() - start}")

start = time.time()
cluster_gpu = cuDBSCAN(eps=eps, min_samples=min_samples)
cluster_gpu.fit(pij_gpu)
print(f"GPU: {time.time() - start}")
[/code]
`
журналы:
[code]size is: (670761, 3)
CPU: 1.508012294769287
[W] [14:24:17.089902] Batch size limited by the chosen integer type (4 bytes). 6007 -> 3201. Using the larger integer type might result in better performance
GPU: 10.168060541152954
[/code]
я распечатал размер pij.
я что-то упустил?
я поискал в Интернете и использовал чатgpt, чтобы найти ответ, но я не смог найти ответ.
Я заметил одну вещь: когда точки ближе, графический процессор имеет тенденцию работать немного быстрее, чем процессор.
у меня nvidia 3090 и относительно мощный компьютер 

Подробнее здесь: [url]https://stackoverflow.com/questions/78754311/question-about-dbscan-from-sklearn-vs-dbscan-from-rapids[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Реализация sklearn.ensemble.GradientBoostingRegressor с помощью sklearn.multioutput.MultiOutputRegressor и sklearn.model

Последнее сообщение Anonymous « 02 дек 2024, 01:49
Добавлено в форуме Python

Anonymous » 02 дек 2024, 01:49 » в форуме Python

Я пытаюсь создать модели, поддерживающие многомерный вывод. Одна из моделей, которые я пытаюсь использовать, — это GradientBoostingRegressor, которая изначально не поддерживает многомерный вывод. Существует обходной путь с помощью...

0 Ответы

49 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 01:49
Реализация sklearn.ensemble.GradientBoostingRegressor с помощью sklearn.multioutput.MultiOutputRegressor и sklearn.model

Последнее сообщение Anonymous « 02 дек 2024, 13:06
Добавлено в форуме Python

Anonymous » 02 дек 2024, 13:06 » в форуме Python

Я пытаюсь создать модели, поддерживающие многомерный вывод. Одна из моделей, которые я пытаюсь использовать, — это GradientBoostingRegressor, которая изначально не поддерживает многомерный вывод. Существует обходной путь с помощью...

0 Ответы

54 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 13:06
Реализация sklearn.ensemble.GradientBoostingRegressor с помощью sklearn.multioutput.MultiOutputRegressor и sklearn.model

Последнее сообщение Anonymous « 07 дек 2024, 02:51
Добавлено в форуме Python

Anonymous » 07 дек 2024, 02:51 » в форуме Python

Я пытаюсь создать модели, поддерживающие многомерный вывод. Одна из моделей, которые я пытаюсь использовать, — это GradientBoostingRegressor, которая изначально не поддерживает многомерный вывод. Существует обходной путь с помощью...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
07 дек 2024, 02:51
Как добавить еще один параметр в sklearn DBSCAN

Последнее сообщение Anonymous « 02 мар 2024, 14:31
Добавлено в форуме Python

Anonymous » 02 мар 2024, 14:31 » в форуме Python

I have a list of points I wish to make as core points for DBSCAN. I am aware that I can subclass sklearn DBSCAN to explicitly set my core points similar to the first comment here: How to provide core points in DBSCAN?

Now, I wish to add something...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
02 мар 2024, 14:31
В событиях Linux Perf PMU нет событий UNCORE_CXL в Sapphire Rapids.

Последнее сообщение Anonymous « 23 июл 2024, 06:16
Добавлено в форуме Linux

Anonymous » 23 июл 2024, 06:16 » в форуме Linux

Я использую Linux 6.5.0 на Xeon 6438, и я заметил, что в Tools/perf/pmu-events/arch/x86/sapphirerapids/ есть файл uncore_cxl.json, который определяет множество cxl связанные события, но я не могу найти их по списку perf, так как же получить доступ к...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
23 июл 2024, 06:16

Вернуться в «Python»