Разработка программного обеспечения с помощью TorchRL для предсказателя человеческих предпочтений [закрыто]

Разработка программного обеспечения с помощью TorchRL для предсказателя человеческих предпочтений [закрыто] ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Разработка программного обеспечения с помощью TorchRL для предсказателя человеческих предпочтений [закрыто]

Цитата

Сообщение Anonymous » 09 окт 2024, 03:22

Я пытаюсь реализовать документ «Глубокое обучение с подкреплением на основе человеческих предпочтений» в PyTorch, используя TorchRL. Я бы хотел, чтобы предсказатель человеческих предпочтений был интегрирован в существующую кодовую базу TorchRL, а не в однозначном переводе ссылочного репозитория, который плохо интегрируется с различными средами.
Мой вопрос следующий:

Где лучше всего добавить такую функцию в существующую базу кода TorchRL, чтобы она хорошо интегрировалась? т. е. как преобразование

Примечание:
Я рассмотрел пример RLHF в репозитории TorchRL, который, насколько я понимаю, не совсем применим, поскольку RLHF выполняется после обучения, а DRLHP — во время обучения.

Подробнее здесь: https://stackoverflow.com/questions/790 ... -predictor

1728433326

Anonymous

Я пытаюсь реализовать документ «Глубокое обучение с подкреплением на основе человеческих предпочтений» в PyTorch, используя TorchRL. Я бы хотел, чтобы предсказатель человеческих предпочтений был интегрирован в существующую кодовую базу TorchRL, а не в однозначном переводе ссылочного репозитория, который плохо интегрируется с различными средами.
Мой вопрос следующий:
[list]
[*]Где лучше всего добавить такую функцию в существующую базу кода TorchRL, чтобы она хорошо интегрировалась? т. е. как преобразование
[/list]
Примечание:
Я рассмотрел пример RLHF в репозитории TorchRL, который, насколько я понимаю, не совсем применим, поскольку RLHF выполняется после обучения, а DRLHP — во время обучения. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79067852/software-engineering-with-torchrl-for-human-preference-predictor[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Разработка программного обеспечения с помощью TorchRL для предсказателя человеческих предпочтений [закрыто]

Последнее сообщение Anonymous « 09 окт 2024, 00:34
Добавлено в форуме Python

Anonymous » 09 окт 2024, 00:34 » в форуме Python

Я пытаюсь реализовать документ «Глубокое обучение с подкреплением на основе человеческих предпочтений» в PyTorch, используя TorchRL. У меня готов веб-интерфейс для выбора предпочтений, а также большой кусок индивидуального преобразования Tensorflow...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
09 окт 2024, 00:34
Разработка программного обеспечения для фотограмметрии на C++ или Python [закрыто]

Последнее сообщение Anonymous « 12 ноя 2024, 23:00
Добавлено в форуме Python

Anonymous » 12 ноя 2024, 23:00 » в форуме Python

Сегодня я решил сделать программу фотограмметрии, потому что я не видел бесплатного программного обеспечения и платной пробной версии, чувствую, что функциональность уже немного устарела, хотелось бы применить более современную и актуальную подход к...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
12 ноя 2024, 23:00
Разработка программного обеспечения для одновременного запуска программ Python

Последнее сообщение Anonymous « 06 янв 2025, 10:26
Добавлено в форуме Python

Anonymous » 06 янв 2025, 10:26 » в форуме Python

Мой вопрос касается не реализации в коде, а скорее базового дизайна или техники, которую мне следует использовать.
Исходная ситуация:
У меня есть программа на Python, которая выполняет симуляцию. Это следует начинать с разными параметрами в разное...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
06 янв 2025, 10:26
Проблема извлечения человеческих силуэтов из сегментированного изображения (felzenszwalb)

Последнее сообщение Anonymous « 12 ноя 2024, 14:12
Добавлено в форуме Python

Anonymous » 12 ноя 2024, 14:12 » в форуме Python

В настоящее время я работаю над извлечением бинарных силуэтов людей на изображении из общедоступного набора данных взаимодействия UT. Я применил к изображению сегментацию Фельценшвалба, чтобы разделить изображение на сегменты в соответствии с...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
12 ноя 2024, 14:12
Начало работы в области разработки программного обеспечения [закрыто]

Последнее сообщение Гость « 22 сен 2023, 21:45
Добавлено в форуме Python

Гость » 22 сен 2023, 21:45 » в форуме Python

Я только что поступил на факультет разработки программного обеспечения, и, честно говоря, я не могу полностью полагаться на учителей, которые научат меня всему, что связано с программной инженерией. Ребята, мне нужна ваша помощь, чтобы рассказать...

0 Ответы

57 Просмотры

Последнее сообщение Гость
22 сен 2023, 21:45

Вернуться в «Python»