LLAMA3 инструктирует 8B галлюцинации, хотя я использую правильный формат подсказки

LLAMA3 инструктирует 8B галлюцинации, хотя я использую правильный формат подсказки ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

LLAMA3 инструктирует 8B галлюцинации, хотя я использую правильный формат подсказки

Цитата

Сообщение Anonymous » 24 апр 2024, 06:45

Я запускаю конечную точку Meta-llama/Meta-Llama-3-8B-Instruct на AWS и по какой-то причине не могу получить приемлемый результат при запросе модели. У него галлюцинации, даже когда я отправляю простую подсказку. Может ли кто-нибудь посоветовать, что я делаю не так?
Примерная подсказка:
system

You are a helpful, respectful and honest assistant. Always answer as helpfully as possible, while being safe. Your answers should not include any harmful, unethical, racist, sexist, toxic, dangerous, or illegal content.
Please ensure that your responses are socially unbiased and positive in nature.
If a question does not make any sense, or is not factually coherent, explain why instead of answering something not correct. If you don't know the answer to a question, please don't share false information.user

Please tell me a jokeassistant

Ответ, который я получаю:
I'd be happy to share a joke with you! Here's one:

Why couldn't the bicycle stand up by itself?

Because it was two-tired!

I hope that brought a smile to your face! Do you want to hear another one?assistant

I'd be happy to share another one! Here's one:

What do you call a fake noodle?

An impasta!

I hope that one made you laugh! Do you want to hear another one?assistant

Here's another one:

Why don't scientists trust atoms?

Because they make up everything!

I hope that one was atom-ically funny! Do you want to hear another one?assistant

Here's another one:

Why don't eggs tell jokes?

Because they'd crack each other up!

I hope that one cracked you up! Do you want to hear another one?assistant

(продолжается некоторое время).
Развертывание:
Я развернул его с помощью:
hub = {
"HF_MODEL_ID": "meta-llama/Meta-Llama-3-8B-Instruct",
"HF_AUTO_CAST_TYPE": "bf16",
"HUGGING_FACE_HUB_TOKEN": "******",
}

llm_image = '763104351884.dkr.ecr.ap-southeast-2.amazonaws.com/huggingface-pytorch-tgi-inference:2.0.1-tgi1.0.3-gpu-py39-cu118-ubuntu20.04'
endpoint_name = 'data-science-llm-llama3-8b'

# create Hugging Face Model Class
llm_model = HuggingFaceModel(
image_uri=llm_image,
env=hub,
role=role,
name=endpoint_name
)

Кварги модели:
model_kwargs:
temperature: 0.001
do_sample: True
max_new_tokens: 500
typical_p: 0.2
seed: 1
use_cache: False
return_full_text: False

Подробнее здесь: https://stackoverflow.com/questions/783 ... mpt-format

1713930325

Anonymous

You are a helpful, respectful and honest assistant. Always answer as helpfully as possible, while being safe. Your answers should not include any harmful, unethical, racist, sexist, toxic, dangerous, or illegal content.
Please ensure that your responses are socially unbiased and positive in nature.
If a question does not make any sense, or is not factually coherent, explain why instead of answering something not correct. If you don't know the answer to a question, please don't share false information.user

Please tell me a jokeassistant

Ответ, который я получаю:
I'd be happy to share a joke with you! Here's one:

Why couldn't the bicycle stand up by itself?

Because it was two-tired!

I hope that brought a smile to your face! Do you want to hear another one?assistant

I'd be happy to share another one! Here's one:

What do you call a fake noodle?

An impasta!

I hope that one made you laugh! Do you want to hear another one?assistant

Here's another one:

Why don't scientists trust atoms?

Because they make up everything!

I hope that one was atom-ically funny! Do you want to hear another one?assistant

Here's another one:

Why don't eggs tell jokes?

Because they'd crack each other up!

I hope that one cracked you up! Do you want to hear another one?assistant

(продолжается некоторое время).
[b]Развертывание:[/b]
Я развернул его с помощью:
hub = {
"HF_MODEL_ID": "meta-llama/Meta-Llama-3-8B-Instruct",
"HF_AUTO_CAST_TYPE": "bf16",
"HUGGING_FACE_HUB_TOKEN": "******",
}

llm_image = '763104351884.dkr.ecr.ap-southeast-2.amazonaws.com/huggingface-pytorch-tgi-inference:2.0.1-tgi1.0.3-gpu-py39-cu118-ubuntu20.04'
endpoint_name = 'data-science-llm-llama3-8b'

# create Hugging Face Model Class
llm_model = HuggingFaceModel(
image_uri=llm_image,
env=hub,
role=role,
name=endpoint_name
)

Кварги модели:
model_kwargs:
temperature: 0.001
do_sample: True
max_new_tokens: 500
typical_p: 0.2
seed: 1
use_cache: False
return_full_text: False

Подробнее здесь: [url]https://stackoverflow.com/questions/78375871/llama3-instruct-8b-hallucinates-even-though-i-am-using-the-correct-prompt-format[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

У ламы2 галлюцинации

Последнее сообщение Anonymous « 08 июл 2024, 15:47
Добавлено в форуме C#

Anonymous » 08 июл 2024, 15:47 » в форуме C#

Я пытаюсь получить ответ из базы данных, но у llama2 галлюцинации. Иногда он дает половинчатый ответ. Например, когда я задал вопрос, перечислите все таблицы, присутствующие в базе данных. В ансе не хватает одной-двух таблиц
using...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
08 июл 2024, 15:47
Требуются ловушки/галлюцинации второго пилота Github [закрыто]

Последнее сообщение Anonymous « 28 окт 2024, 18:50
Добавлено в форуме Python

Anonymous » 28 окт 2024, 18:50 » в форуме Python

Я готовлю небольшое введение в github copilot для Python для моих студентов первого курса программирования. Конечно, при этом также должен быть раздел о подводных камнях.
Есть ли какие-либо проблемы или галлюцинации, с которыми вы столкнулись при...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
28 окт 2024, 18:50
Загрузка версии llama3 int8 из llama.cpp

Последнее сообщение Anonymous « 27 июн 2024, 12:04
Добавлено в форуме Linux

Anonymous » 27 июн 2024, 12:04 » в форуме Linux

Я пытаюсь загрузить 8-битную квантованную версию llama3 на свой локальный ноутбук (Linux) из llama.cpp, но процесс прерывается из-за превышения памяти.
Есть ли способ обойти это?
Я уже работал с 4-битной версией, и она работает без проблем...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
27 июн 2024, 12:04
Точная настройка llama3 с ответами на сообщения, такими как набор данных (слабое)

Последнее сообщение Anonymous « 30 июн 2024, 02:18
Добавлено в форуме Python

Anonymous » 30 июн 2024, 02:18 » в форуме Python

Я хочу точно настроить llama3 для набора данных, в котором структура данных представляет собой список сообщений, с учетом следующих правил:

есть каналы.
в каждом канале есть сообщения от самых разных пользователей.
каждое сообщение может иметь...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
30 июн 2024, 02:18
Точная настройка llama3 с ответами на сообщения, такими как набор данных (слабо)

Последнее сообщение Anonymous « 30 июн 2024, 11:25
Добавлено в форуме Python

Anonymous » 30 июн 2024, 11:25 » в форуме Python

Я хочу точно настроить llama3 для набора данных, в котором структура данных представляет собой список сообщений, с учетом следующих правил:

есть каналы.
в каждом канале есть сообщения от самых разных пользователей.
каждое сообщение может иметь...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
30 июн 2024, 11:25

Вернуться в «Python»