Оценка модели с помощью MT-Bench с использованием предварительно сгенерированных ответов модели.

Оценка модели с помощью MT-Bench с использованием предварительно сгенерированных ответов модели. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Оценка модели с помощью MT-Bench с использованием предварительно сгенерированных ответов модели.

Цитата

Сообщение Anonymous » 25 июн 2024, 19:14

Я хочу найти оценку LLM в MT-Bench (скажем, EleutherAI/pythia-1b). Мне удалось запустить команду

python gen_model_answer .py --model-pat EleutherAI/pythia-1b --model-id pythia-1b

для генерации ответов, и я мог видеть результат в json "data/mt_bench/model_answer/pythia-1b.jsonl".
Я загрузил предварительно сгенерированные ответы модели с помощью команды

python3 download_mt_bench_pregenerated .py

Как сравнить ответ, сгенерированный "pythia-1b", и любой предварительно сгенерированный ответ (скажем, llama-13b), чтобы вычислить оценку MT-Bench для " модель «Пифия-1b» ?

Подробнее здесь: https://stackoverflow.com/questions/786 ... el-answers

1719332068

Anonymous

Я хочу найти оценку LLM в MT-Bench (скажем, EleutherAI/pythia-1b). Мне удалось запустить команду

python gen_model_answer .py --model-pat EleutherAI/pythia-1b --model-id pythia-1b

для генерации ответов, и я мог видеть результат в json "data/mt_bench/model_answer/pythia-1b.jsonl".
Я загрузил предварительно сгенерированные ответы модели с помощью команды

python3 download_mt_bench_pregenerated .py

Как сравнить ответ, сгенерированный "pythia-1b", и любой предварительно сгенерированный ответ (скажем, llama-13b), чтобы вычислить оценку MT-Bench для " модель «Пифия-1b» ? 

Подробнее здесь: [url]https://stackoverflow.com/questions/78668165/mt-bench-evaluation-of-a-model-using-pre-generated-model-answers[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ошибки Scrapy Bench с AssertionError при выполнении

Последнее сообщение Anonymous « 25 янв 2025, 17:04
Добавлено в форуме Python

Anonymous » 25 янв 2025, 17:04 » в форуме Python

Я выполнил эту команду для установки conda install -c conda-forge Scrapy Pylint Autopep8 -y
затем я запустил scrapy Bench , чтобы получить приведенная ниже ошибка.
То же самое происходит при глобальной установке с помощью команды pip.
Пожалуйста,...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
25 янв 2025, 17:04
Ошибки Scrapy Bench с AssertionError при выполнении

Последнее сообщение Anonymous « 27 янв 2025, 14:10
Добавлено в форуме Python

Anonymous » 27 янв 2025, 14:10 » в форуме Python

Я запустил эту команду, чтобы установить Conda stall -c conda -forge скрара pylint autopep8 -y
Тогда я запустил Scrapy Bench , чтобы получить Приведенная ниже ошибка.
То же самое происходит в команде Global через Pip .
Пожалуйста, помогите, так как...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
27 янв 2025, 14:10
Python, эквивалентный функции R `Bench :: Bench_memory ()`?

Последнее сообщение Anonymous « 15 апр 2025, 10:06
Добавлено в форуме Python

Anonymous » 15 апр 2025, 10:06 » в форуме Python

Я сравниваю память некоторых функций в R и Python и прекрасно провел время, получая результаты с пакетом Bench в R, который отслеживает все ассигнования по каждому вызову, позволяя мне получить общее и пиковое распределение, принимая сумму и...

0 Ответы

1 Просмотры

Последнее сообщение Anonymous
15 апр 2025, 10:06
AggregateUpdateConcurrencyException при использовании агрегатных DDD и предварительно сгенерированных идентификаторов

Последнее сообщение Anonymous « 13 мар 2025, 22:05
Добавлено в форуме C#

Anonymous » 13 мар 2025, 22:05 » в форуме C#

У меня есть пациент -совокупный корневой сущность со списком детей посещения детей. В соответствии с принципами DDD любая операция на объекте посещения выполняется через совокупный корень. Кроме того, любая настойчивость должна сохранять саму...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
13 мар 2025, 22:05
AggregateUpdateConcurrencyException при использовании агрегатных DDD и предварительно сгенерированных идентификаторов

Последнее сообщение Anonymous « 13 мар 2025, 23:03
Добавлено в форуме C#

Anonymous » 13 мар 2025, 23:03 » в форуме C#

У меня есть пациент Совокупный корневой сущность со списком визита дочерних объектов. В соответствии с принципами DDD любая операция на объекте визита выполняется через корень агрегирования. Кроме того, любая настойчивость должна сохранять саму...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
13 мар 2025, 23:03

Вернуться в «Python»