Какова функция потери, используемая в тренере из библиотеки Transformers об обнимании? Из библиотеки Transformers обнимающегося лица.
В своей документации они упоминают, что можно указать настроенную функцию потерь, переварив метод compute_loss в классе. Однако, если я не делаю переопределение метода и использую тренер, чтобы тонко поднять модель BERT непосредственно для классификации настроений, какова функция потери по умолчанию? Это категорическая кроссентропия? Спасибо!
Подробнее здесь: https://stackoverflow.com/questions/715 ... y-of-huggi