Существует ли реализация алгоритма ATRPO, допускающая дискретные действия? - Цифровое Кемерово

Существует ли реализация алгоритма ATRPO, допускающая дискретные действия? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Существует ли реализация алгоритма ATRPO, допускающая дискретные действия?

Цитата

Сообщение Anonymous » 29 май 2024, 18:47

Я работаю над проектом со своим учителем, и мы намеревались протестировать ATRPO (TRPO со средним вознаграждением) на основе различных современных алгоритмов. Однако мне удалось найти только одну библиотеку, которая ее использует (https://github.com/sony/nnabla-rl), и, к сожалению, она реализована таким образом, что не поддерживает дискретные действия, а это значит, что мы не могли использовать предполагаемую среду.
Возможно, существует ли альтернативная реализация этого кода, которая могла бы работать для этого? Я действительно не смог найти ничего подобного, и у меня не было опыта, чтобы попытаться полностью запрограммировать это самостоятельно, поэтому я решил спросить здесь. Мне просто нужно что-то, что я мог бы использовать для сред с дискретными действиями, даже если это не входит в библиотеку.
Заранее спасибо!

Подробнее здесь: https://stackoverflow.com/questions/785 ... rete-actio

Реклама

1716997655

Anonymous

Я работаю над проектом со своим учителем, и мы намеревались протестировать ATRPO (TRPO со средним вознаграждением) на основе различных современных алгоритмов. Однако мне удалось найти только одну библиотеку, которая ее использует (https://github.com/sony/nnabla-rl), и, к сожалению, она реализована таким образом, что не поддерживает дискретные действия, а это значит, что мы не могли использовать предполагаемую среду.
Возможно, существует ли альтернативная реализация этого кода, которая могла бы работать для этого? Я действительно не смог найти ничего подобного, и у меня не было опыта, чтобы попытаться полностью запрограммировать это самостоятельно, поэтому я решил спросить здесь. Мне просто нужно что-то, что я мог бы использовать для сред с дискретными действиями, даже если это не входит в библиотеку.
Заранее спасибо! 

Подробнее здесь: [url]https://stackoverflow.com/questions/78550664/is-there-an-implementation-of-the-atrpo-algorithm-that-allows-for-discrete-actio[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Android реализация срока действия срока действия срока действия с использованием таймера обратного отсчета, даже когда п

Последнее сообщение Anonymous « 20 фев 2025, 23:49
Добавлено в форуме Android

Anonymous » 20 фев 2025, 23:49 » в форуме Android

У меня есть приложение Emerce, в котором у меня есть список элементов, которые поступают из бэкэнда, каждый элемент имеет свою продолжительность истечения срока действия (5 минут) для демонстрации скидки.
Каждый раз Я называю API, он отправляет мне...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 23:49
Могу ли я в гистограмме Python переключать дискретные элементы оси X в дополнение к легенде?

Последнее сообщение Anonymous « 01 ноя 2024, 19:25
Добавлено в форуме Python

Anonymous » 01 ноя 2024, 19:25 » в форуме Python

У меня есть такой график, на котором показаны «показатели» в разных «регионах»:
net/iVilmAIj.png

Я могу фильтровать регионы, щелкнув легенду, и могу переключиться на отображение отдельных показателей с помощью раскрывающегося меню.
Чего я хочу:...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
01 ноя 2024, 19:25
Как преобразовать дискретные варианты (цвета) из вывода нейронной сети в цвета непосредственно в TensorFlow?

Последнее сообщение Anonymous « 26 май 2025, 08:29
Добавлено в форуме Python

Anonymous » 26 май 2025, 08:29 » в форуме Python

Контекст: я учусь использовать Tensorflow и хочу провести простой эксперимент, где я предоставляю нейронную сеть с 4 вариантами цвета для каждого пикселя. Сеть должна научиться выбирать лучшие цвета из выбора, доступных для каждого пикселя, чтобы...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
26 май 2025, 08:29
ASPNET возвращает BadRequest, когда модель API, не допускающая значения NULL, указывает нулевое значение

Последнее сообщение Гость « 14 мар 2024, 09:08
Добавлено в форуме C#

Гость » 14 мар 2024, 09:08 » в форуме C#

Просто интересно, есть ли способ, позволяющий веб-API ASP.NET автоматически не возвращать неверный ответ на запрос при попытке вызвать действие контроллера, имеющее модель со свойством, не допускающим значения NULL, которому присвоено значение...

0 Ответы

35 Просмотры

Последнее сообщение Гость
14 мар 2024, 09:08
Проверка JSR @Pattern, допускающая нулевые значения

Последнее сообщение Anonymous « 02 июл 2024, 12:29
Добавлено в форуме JAVA

Anonymous » 02 июл 2024, 12:29 » в форуме JAVA

Когда я аннотирую поле с помощью @Pattern
@Pattern(regexp= someRegexp )
public String name;

Если JSON содержит это поле со значением null , то я ожидаю, что это регулярное выражение завершится ошибкой и, следовательно, недействительным.
если JSON...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
02 июл 2024, 12:29

Вернуться в «Python»

Programmiererforum