Эффективное использование конвейеров преобразователей Hugging Face на графическом процессоре с большими наборами данных

Эффективное использование конвейеров преобразователей Hugging Face на графическом процессоре с большими наборами данных ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Эффективное использование конвейеров преобразователей Hugging Face на графическом процессоре с большими наборами данных

Цитата

Сообщение Anonymous » 01 янв 2024, 20:33

Я относительно новичок в Python и столкнулся с некоторыми проблемами с производительностью при использовании Hugging Face Transformers для анализа настроений в относительно большом наборе данных. Я создал DataFrame с 6000 строками текстовых данных на испанском языке и применяю конвейер анализа настроений к каждой строке текста. Вот упрощенная версия моего кода:

импортировать панд как pd импортный фонарь из tqdm импортировать tqdm из трубопровода импорта трансформаторов данные = { «ТД»: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'текст': [ # ... (здесь ваши текстовые данные) ] } df_model = pd.DataFrame (данные) устройство = 0, если torch.cuda.is_available(), иначе -1 py_sentimiento = конвейер("анализ настроений", модель="finiteautomata/beto-sentiment-anaанализ", tokenizer="finiteautomata/beto-sentiment-anaанализ", устройство=устройство, truncation=True) tqdm.pandas() df_model['py_sentimiento'] = df_model['text'].progress_apply(py_sentimiento) df_model['py_sentimiento'] = df_model['py_sentimiento'].apply(lambda x: x[0]['label']) Однако я обнаружил предупреждающее сообщение, предлагающее использовать набор данных для более эффективной обработки. Предупреждающее сообщение выглядит следующим образом:

«Похоже, вы используете конвейеры последовательно на графическом процессоре. Чтобы максимизировать эффективность, используйте набор данных». У меня два вопроса:

Что означает это предупреждение и почему мне следует использовать набор данных для повышения эффективности?

Как я могу изменить свой код для пакетной обработки данных и использования параллельных вычислений, чтобы лучше использовать ресурсы моего графического процессора, какой код, функцию или библиотеку следует использовать с преобразователями обнимающих лиц?

Я хочу изучать и оптимизировать свой код.

1704130410

Anonymous


Я относительно новичок в Python и столкнулся с некоторыми проблемами с производительностью при использовании Hugging Face Transformers для анализа настроений в относительно большом наборе данных. Я создал DataFrame с 6000 строками текстовых данных на испанском языке и применяю конвейер анализа настроений к каждой строке текста. Вот упрощенная версия моего кода:
 
импортировать панд как pd импортный фонарь из tqdm импортировать tqdm из трубопровода импорта трансформаторов данные = {     «ТД»: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],     'текст': [         # ... (здесь ваши текстовые данные)     ] } df_model = pd.DataFrame (данные) устройство = 0, если torch.cuda.is_available(), иначе -1 py_sentimiento = конвейер("анализ настроений", модель="finiteautomata/beto-sentiment-anaанализ", tokenizer="finiteautomata/beto-sentiment-anaанализ", устройство=устройство, truncation=True) tqdm.pandas() df_model['py_sentimiento'] = df_model['text'].progress_apply(py_sentimiento) df_model['py_sentimiento'] = df_model['py_sentimiento'].apply(lambda x: x[0]['label'])  Однако я обнаружил предупреждающее сообщение, предлагающее использовать набор данных для более эффективной обработки. Предупреждающее сообщение выглядит следующим образом:
 
«Похоже, вы используете конвейеры последовательно на графическом процессоре. Чтобы максимизировать эффективность, используйте набор данных».  У меня два вопроса:
 
Что означает это предупреждение и почему мне следует использовать набор данных для повышения эффективности?
 
Как я могу изменить свой код для пакетной обработки данных и использования параллельных вычислений, чтобы лучше использовать ресурсы моего графического процессора, какой код, функцию или библиотеку следует использовать с преобразователями обнимающих лиц?
 
Я хочу изучать и оптимизировать свой код.

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Математические вычисления, выполняемые на процессоре, дают разные результаты на графическом процессоре

Последнее сообщение Anonymous « 09 май 2024, 19:51
Добавлено в форуме C++

Anonymous » 09 май 2024, 19:51 » в форуме C++

Я пытаюсь заставить шейдер фрагментов GLSL искажать входящие фрагменты на основе их текстурных координат, чтобы плохо имитировать CRT.
После того, как код не заработал, я перенес его на C++, чтобы изменить значения RGB текстуры. Код работал так, как...

0 Ответы

88 Просмотры

Последнее сообщение Anonymous
09 май 2024, 19:51
Выполнение операций на графическом процессоре, а не на процессоре (вычисление числа Pi) [закрыто]

Последнее сообщение Anonymous « 31 июл 2024, 21:12
Добавлено в форуме C#

Anonymous » 31 июл 2024, 21:12 » в форуме C#

Недавно я много читал о программном обеспечении (в основном научном/математическом и шифровальном), которое переносит часть вычислений на графический процессор, что приводит к увеличению скорости поддерживаемых операций в 100–1000 (!) раз. >

Есть...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
31 июл 2024, 21:12
Как указать Python работать на процессоре, а не на графическом процессоре при использовании рабочей станции?

Последнее сообщение Anonymous « 04 окт 2024, 02:40
Добавлено в форуме Python

Anonymous » 04 окт 2024, 02:40 » в форуме Python

Я относительно новичок в аппаратном обеспечении графических процессоров. Раньше я часто использовал Google Colab и могу указать тип среды выполнения (ЦП, ГП), чтобы контролировать, где будет выполняться мой код Python.
Недавно у меня появилась...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
04 окт 2024, 02:40
Как указать Python, чтобы он работал на процессоре, а не на графическом процессоре при использовании рабочей станции?

Последнее сообщение Anonymous « 04 окт 2024, 03:56
Добавлено в форуме Python

Anonymous » 04 окт 2024, 03:56 » в форуме Python

Я относительно новичок в аппаратном обеспечении графических процессоров. Раньше я часто использовал Google Colab для обучения LLM с использованием pytorch, и я могу указать тип среды выполнения (ЦП и ГП), чтобы контролировать, где будет выполняться...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
04 окт 2024, 03:56
Почему моя программа CUDA работает медленнее на графическом процессоре (RTX 3070 Mobile), чем на процессоре (AMD R7 5800

Последнее сообщение Anonymous « 16 янв 2025, 15:14
Добавлено в форуме C++

Anonymous » 16 янв 2025, 15:14 » в форуме C++

Я работаю над программой CUDA в WSL2 (Ubuntu 20.04) для тестирования ускорения графического процессора. Мое оборудование включает AMD R7 5800H и NVIDIA RTX 3070 Mobile. Я сравнил время выполнения моей программы на процессоре (последовательное...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
16 янв 2025, 15:14

Вернуться в «Python»