Рекомендуемая конфигурация GenerationConfig для студентов LLM в медицинской области: стратегии минимизации галлюцинаций

Рекомендуемая конфигурация GenerationConfig для студентов LLM в медицинской области: стратегии минимизации галлюцинаций ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 23 мар 2026, 17:56

В настоящее время я развертываю большую языковую модель (например, Llama 3/Mistral) для медицинского применения, особенно для таких задач, как обобщение клинических записей и извлечение информации из отчетов об онкологиях.
В клинических условиях фактическая точность и последовательность гораздо более важны, чем лингвистическое творчество. Мне нужен совет о том, как оптимизировать GenerationConfig, чтобы обеспечить максимально безопасный вывод.
В частности, у меня есть следующие вопросы:

Температура и Top-p: Является ли стандартной практикой устанавливать температуру на очень низкое значение (например, 0,1 или даже 0) для максимизации детерминизма, или это приводит к повторяющийся/ухудшенный результат в медицинском контексте?
Параметры штрафа: Как мне сбалансировать повторение_пеналти и присутствие_пеналти, чтобы не пропускать важные медицинские симптомы и при этом не допускать зацикливания модели?

Любые идеи или документы, касающиеся настройки параметров для важных задач LLM для конкретной предметной области будем очень признательны.

1774277813

Anonymous

В настоящее время я развертываю большую языковую модель (например, Llama 3/Mistral) для медицинского применения, особенно для таких задач, как обобщение клинических записей и извлечение информации из отчетов об онкологиях.
В клинических условиях фактическая точность и последовательность гораздо более важны, чем лингвистическое творчество. Мне нужен совет о том, как оптимизировать GenerationConfig, чтобы обеспечить максимально безопасный вывод.
В частности, у меня есть следующие вопросы:
[list]
[*][b]Температура и Top-p:[/b] Является ли стандартной практикой устанавливать температуру на очень низкое значение (например, 0,1 или даже 0) для максимизации детерминизма, или это приводит к повторяющийся/ухудшенный результат в медицинском контексте?

[*][b]Параметры штрафа:[/b] Как мне сбалансировать повторение_пеналти и присутствие_пеналти, чтобы не пропускать важные медицинские симптомы и при этом не допускать зацикливания модели?

[/list]
Любые идеи или документы, касающиеся настройки параметров для важных задач LLM для конкретной предметной области будем очень признательны.

Ответить

1 сообщение • Страница 1 из 1