Почему GPT4All не соответствует строго формату JSON, указанному в приглашении, и не добавляет дополнительный текст? - Цифровое Кемерово

Почему GPT4All не соответствует строго формату JSON, указанному в приглашении, и не добавляет дополнительный текст? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Почему GPT4All не соответствует строго формату JSON, указанному в приглашении, и не добавляет дополнительный текст?

Цитата

Сообщение Anonymous » 29 ноя 2024, 18:28

Я использую GPT4All в скрипте Python для классификации электронных писем по категориям, приоритету и требованиям к ответу. Несмотря на четкое указание строгого формата JSON и инструкции по исключению дополнительного текста, LLM часто выводит неверный JSON, включает комментарии или пояснения, а иногда добавляет нежелательные заполнители, такие как
или « ». Такое поведение затрудняет программную обработку выходных данных LLM.
Я использовал следующие MODEL_SETTINGS, чтобы гарантировать, что LLM генерирует детерминированные и целенаправленные выходные данные:

Код: Выделить всё

MODEL_SETTINGS = {
"temp": 0.0,  # Ensures deterministic outputs
"top_p": 0.5,  # Focuses on the highest probability tokens
"top_k": 1,  # Chooses the top token every time
"repeat_penalty": 2.5,  # Penalizes repetitive sequences
}

prompt = (
f"\n"
f"You are an AI system that only outputs JSON objects. Your task is to classify the following email into a predefined JSON format.\n\n"
f"Email details:\n"
f"Subject: \"{subject}\"\n"
f"Sender: \"{sender}\"\n\n"
f"### Output Format\n"
f"Respond only in this JSON format:\n"
f"{{\n"
f"    \"Category\": \"\",\n"
f"    \"Priority\": \"\",\n"
f"    \"RequiresResponse\": \"\"\n"
f"}}\n\n"
f"### Example Response\n"
f"{{\n"
f"   \"Category\": \"Work\",\n"
f"   \"Priority\": \"Normal\",\n"
f"   \"RequiresResponse\": \"No\"\n"
f"}}\n\n"
f"### Important Instructions\n"
f"1. Output *only* a single JSON object in the exact format provided above.\n"
f"2. *Do not include any additional text, comments, explanations, or blank lines.*\n"
f"3. Your response *must* be a valid JSON object with proper capitalization, syntax (double quotes, etc.), and no trailing commas.\n"
f"4. If you cannot classify the email, leave the values blank (e.g., \"Category\": \"\") but maintain the JSON structure.\n\n"
f"Now classify the email:\n"
f"%1\n"
f"\n"
f"%2\n"
)

Я ожидал, что LLM выведет действительный объект JSON, строго соответствующий указанному формату, например:

Код: Выделить всё

{
"Category": "Work",
"Priority": "Normal",
"RequiresResponse": "No"
}

Что на самом деле произошло?
LLM часто выдает ответы с такими вопросами, как:
• Дополнительный текст, пояснения или комментарии.
• Недопустимая структура JSON с отсутствующими кавычками или ключами.
• Ненужные заполнители, такие как
, " " или %1.

Подробнее здесь: https://stackoverflow.com/questions/792 ... prompt-and

Реклама

1732894134

Anonymous

Я использую GPT4All в скрипте Python для классификации электронных писем по категориям, приоритету и требованиям к ответу. Несмотря на четкое указание строгого формата JSON и инструкции по исключению дополнительного текста, LLM часто выводит неверный JSON, включает комментарии или пояснения, а иногда добавляет нежелательные заполнители, такие как
или « ». Такое поведение затрудняет программную обработку выходных данных LLM.
Я использовал следующие MODEL_SETTINGS, чтобы гарантировать, что LLM генерирует детерминированные и целенаправленные выходные данные:
[code]MODEL_SETTINGS = {
"temp": 0.0,  # Ensures deterministic outputs
"top_p": 0.5,  # Focuses on the highest probability tokens
"top_k": 1,  # Chooses the top token every time
"repeat_penalty": 2.5,  # Penalizes repetitive sequences
}

prompt = (
f"\n"
f"You are an AI system that only outputs JSON objects. Your task is to classify the following email into a predefined JSON format.\n\n"
f"Email details:\n"
f"Subject: \"{subject}\"\n"
f"Sender: \"{sender}\"\n\n"
f"### Output Format\n"
f"Respond only in this JSON format:\n"
f"{{\n"
f"    \"Category\": \"\",\n"
f"    \"Priority\": \"\",\n"
f"    \"RequiresResponse\": \"\"\n"
f"}}\n\n"
f"### Example Response\n"
f"{{\n"
f"   \"Category\": \"Work\",\n"
f"   \"Priority\": \"Normal\",\n"
f"   \"RequiresResponse\": \"No\"\n"
f"}}\n\n"
f"### Important Instructions\n"
f"1. Output *only* a single JSON object in the exact format provided above.\n"
f"2. *Do not include any additional text, comments, explanations, or blank lines.*\n"
f"3. Your response *must* be a valid JSON object with proper capitalization, syntax (double quotes, etc.), and no trailing commas.\n"
f"4. If you cannot classify the email, leave the values blank (e.g., \"Category\": \"\") but maintain the JSON structure.\n\n"
f"Now classify the email:\n"
f"%1\n"
f"\n"
f"%2\n"
)
[/code]
Я ожидал, что LLM выведет действительный объект JSON, строго соответствующий указанному формату, например:
[code]{
"Category": "Work",
"Priority": "Normal",
"RequiresResponse": "No"
}
[/code]
Что на самом деле произошло?
LLM часто выдает ответы с такими вопросами, как:
• Дополнительный текст, пояснения или комментарии.
• Недопустимая структура JSON с отсутствующими кавычками или ключами.
• Ненужные заполнители, такие как
, " " или %1. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79237605/why-does-gpt4all-not-strictly-follow-the-json-format-specified-in-the-prompt-and[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему GPT4All не соответствует строго формату JSON, указанному в приглашении, и не добавляет дополнительный текст?

Последнее сообщение Anonymous « 29 ноя 2024, 19:54
Добавлено в форуме Python

Anonymous » 29 ноя 2024, 19:54 » в форуме Python

Я использую GPT4All в скрипте Python для классификации электронных писем по категориям, приоритету и требованиям к ответу. Несмотря на четкое указание строгого формата JSON и инструкции по исключению дополнительного текста, LLM часто выводит...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
29 ноя 2024, 19:54
Python GPT4ALL дает ошибку для libllama.so Python: 3.12-слей

Последнее сообщение Anonymous « 04 авг 2025, 08:34
Добавлено в форуме Python

Anonymous » 04 авг 2025, 08:34 » в форуме Python

Я пытаюсь использовать gpt4all в python: 3.12-slim image.
Я создал dockerfile , как ниже.
FROM python:3.12-slim

RUN pip install setuptools gpt4all

CMD

Я создал тест изображение с помощью Docker Build Command
% docker build . -t test...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
04 авг 2025, 08:34
Могу ли я определить, соответствует ли формат файла ожидаемому формату при чтении его на Python?

Последнее сообщение Anonymous « 15 окт 2024, 11:42
Добавлено в форуме Python

Anonymous » 15 окт 2024, 11:42 » в форуме Python

Я пишу сценарий, который требует от пользователей размещать в каталоге текстовые файлы формата FASTA. Сценарий вызовет подпроцесс, который завершится ошибкой, если файл не в формате FASTA, и я хотел бы сообщить пользователю, почему подпроцесс...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
15 окт 2024, 11:42
Почему мой выход Create_spend_chart не соответствует требуемому формату? [закрыто]

Последнее сообщение Anonymous « 26 апр 2025, 10:38
Добавлено в форуме Python

Anonymous » 26 апр 2025, 10:38 » в форуме Python

Я пытаюсь решить проект, в котором я создаю класс категорий и функцию create_spend_chart, чтобы создать текстовую диаграмму трат. Пример, имена моей категории, напечатанные вертикально, не совсем выровнены с барами, а иногда отсутствуют...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
26 апр 2025, 10:38
Почему мой выход Create_spend_chart не соответствует требуемому формату? [закрыто]

Последнее сообщение Anonymous « 26 апр 2025, 14:05
Добавлено в форуме Python

Anonymous » 26 апр 2025, 14:05 » в форуме Python

Я пытаюсь решить проект, в котором я создаю класс категорий и функцию create_spend_chart, чтобы создать текстовую диаграмму трат. Пример, имена моей категории, напечатанные вертикально, не совсем совместно выровнены с столбцами, а иногда отсутствуют...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
26 апр 2025, 14:05

Вернуться в «Python»

Programmiererforum