Почему исходная модель ("csebuetnlp/mT5_multilingual_XLSum") дала хорошие результаты при тестировании ее на арабских образцах, но при тестировании точно настроенной модели на наборе данных XLSUM для 10 эпох она не дала хороших результатов. Хотя измерения румян хороши при тонкой настройке, потери при обучении и проверке близки к нулю.
Подробнее здесь: https://stackoverflow.com/questions/788 ... ic-dataset
Точная настройка MT5 на арабском наборе данных ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Точная настройка llama3 с ответами на сообщения, такими как набор данных (слабое)
Anonymous » » в форуме Python - 0 Ответы
- 18 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Точная настройка llama3 с ответами на сообщения, такими как набор данных (слабо)
Anonymous » » в форуме Python - 0 Ответы
- 19 Просмотры
-
Последнее сообщение Anonymous
-
-
-
SBERT Точная настройка всегда останавливается до завершения всех эпох.
Anonymous » » в форуме Python - 0 Ответы
- 10 Просмотры
-
Последнее сообщение Anonymous
-