Загадка большой языковой модели

Загадка большой языковой модели ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 17 окт 2024, 21:24

В настоящее время я использую GPT-3 и пытаюсь сравнить его возможности с соответствующими языковыми моделями для своей магистерской диссертации.
К сожалению, GPT-3 — это приложение на основе API, поэтому я не могу извлекать метрики. например, недоумение.
Через API у меня есть доступ к этим трем показателям и, конечно же, к выводам моделей:

training_loss: потеря в обучающем пакете
training_sequence_accuracy: процент завершений в обучающем пакете, для которых предсказанные моделью токены соответствовали истинные токены завершения точно. Например, с размером пакета, равным 3, если ваши данные содержат завершения [[1, 2], [0, 5], [4, 2]] и предсказание модели [[1, 1], [0, 5] , [4, 2]], эта точность составит 2/3 = 0,67
training_token_accuracy: процент токенов в обучающем пакете, который были правильно предсказаны моделью. Например, с размером пакета, равным 3, если ваши данные содержат завершения [[1, 2], [0, 5], [4, 2]] и предсказание модели [[1, 1], [0, 5] , [4, 2]], эта точность составит 5/6 = 0,83

Есть ли возможность вычислить сложность моей модели с использованием Python?
Спасибо.

Подробнее здесь: https://stackoverflow.com/questions/716 ... perplexity

1729189488

Anonymous

В настоящее время я использую GPT-3 и пытаюсь сравнить его возможности с соответствующими языковыми моделями для своей магистерской диссертации.
К сожалению, GPT-3 — это приложение на основе API, поэтому я не могу извлекать метрики. например, недоумение.
Через API у меня есть доступ к этим трем показателям и, конечно же, к выводам моделей:
[list]
[*] training_loss: потеря в обучающем пакете

[*]training_sequence_accuracy: процент завершений в обучающем пакете, для которых предсказанные моделью токены соответствовали истинные токены завершения точно. Например, с размером пакета, равным 3, если ваши данные содержат завершения [[1, 2], [0, 5], [4, 2]] и предсказание модели [[1, 1], [0, 5] , [4, 2]], эта точность составит 2/3 = 0,67

[*]training_token_accuracy: процент токенов в обучающем пакете, который были правильно предсказаны моделью. Например, с размером пакета, равным 3, если ваши данные содержат завершения [[1, 2], [0, 5], [4, 2]] и предсказание модели [[1, 1], [0, 5] , [4, 2]], эта точность составит 5/6 = 0,83

[/list]
Есть ли возможность вычислить сложность моей модели с использованием Python?
Спасибо. 

Подробнее здесь: [url]https://stackoverflow.com/questions/71690297/large-language-model-perplexity[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Загадка ошибки компилятора Java: «внутренние классы не могут иметь статические объявления» - за исключением простых типо

Последнее сообщение Anonymous « 03 окт 2024, 20:51
Добавлено в форуме JAVA

Anonymous » 03 окт 2024, 20:51 » в форуме JAVA

Во время написания кода я столкнулся со странным поведением компилятора Java.

При компиляции класса (источник ниже) компилятор выдает ошибку ( inner classes cannot have static declarations ) для переменной класса NULL. Это ожидаемо!

Однако в...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
03 окт 2024, 20:51
CSS в гнездование и: is () загадка селектора

Последнее сообщение Anonymous « 25 фев 2025, 20:52
Добавлено в форуме CSS

Anonymous » 25 фев 2025, 20:52 » в форуме CSS

сегодня я наткнулся на странное явление. Следующий код работает, как и ожидалось -
table
{
background-color: var(--bg-accent);
border: solid var(--bg-accent-border);
border-width: 1px 0px 0px 1px;
border-collapse: collapse;
margin: 2rem auto 2rem...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
25 фев 2025, 20:52
Я застрял при импорте языковой модели openhermes 2.5, выдает ошибку неправильного запроса 400.

Последнее сообщение Гость « 03 мар 2024, 11:47
Добавлено в форуме Python

Гость » 03 мар 2024, 11:47 » в форуме Python

Here is my code for chat completion.

response = client.chat.completions.create( model= models/openhermes-2.5-mistral-7b , messages= ) Here is the error:
BadRequestError: Error code: 400 - {'error': {'message': 'invalid model ID',...

0 Ответы

55 Просмотры

Последнее сообщение Гость
03 мар 2024, 11:47
Использование языковой модели Phi-3-Mini квантовая версия в ноутбуке Юпитера

Последнее сообщение Anonymous « 02 фев 2025, 12:41
Добавлено в форуме Python

Anonymous » 02 фев 2025, 12:41 » в форуме Python

Я пытаюсь использовать небольшую языковую модель в ноутбуке Юпитера и не могу найти рабочее решение. Я хочу использовать квантовую версию Phi-3-Mini, так как она достаточно мала, чтобы поместиться на моем GPU, и работает быстрее. But when loading...

0 Ответы

35 Просмотры

Последнее сообщение Anonymous
02 фев 2025, 12:41
Оценка языковой модели с пользовательской задачей - Объятие Face Lileateval

Последнее сообщение Anonymous « 30 июн 2025, 15:48
Добавлено в форуме Python

Anonymous » 30 июн 2025, 15:48 » в форуме Python

Я создаю эталон для оценки языковой модели. Во -первых, я сгенерировал набор данных, с которым я собираюсь предложить языковую модель. Впоследствии я попытался оценить любую крошечную языковую модель, чтобы получить сквозное небольшое...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
30 июн 2025, 15:48

Вернуться в «Python»