Как я могу заставить или переобучить языковую модель для прогнозирования с использованием определенных слов/фраз? [закры

Как я могу заставить или переобучить языковую модель для прогнозирования с использованием определенных слов/фраз? [закры ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как я могу заставить или переобучить языковую модель для прогнозирования с использованием определенных слов/фраз? [закры

Цитата

Сообщение Anonymous » 15 июл 2024, 15:42

Я пытаюсь создать программу, которая отображает слово и позволяет пользователю попытаться произнести то, что отображается на экране, в качестве введения в произношение и словарный запас. Язык, с которым я работаю, – тайский, но примеры здесь будут на английском языке.
Некоторые основные отправные точки я нашел в репозитории GitHub (https://github.com/PyThaiNLP/). pythaiasr), который я смог использовать для прогнозирования произносимых мной предложений. Он основан на существующих моделях, таких как этот набор данных HuggingFace. Я не знаю, работает ли он, используя словарь слов или комбинируя фонемы для создания слов.
В любом случае, как я могу заставить его прогнозировать (и получать уровни достоверности) на основе определенный набор слов/фраз? Всего их будет 44, по одной на каждую согласную в алфавите.
Например, в английской программе могут быть «фразы»:

Код: Выделить всё

[b ball, k car, d dog, f fish, j jelly, l lemon, m moon, ...]

И не распознает эти примеры путаницы:

Код: Выделить всё

[b car, d fish, l dog, m ball, ...]

Предположим, что слова уже существуют в языке.
Я немного новичок в искусственном интеллекте и нейронных сетях в целом, но если кто-то может указать мне на метод или структуру, я смогу взять их оттуда. Спасибо!

Подробнее здесь: https://stackoverflow.com/questions/787 ... words-phra

1721047374

Anonymous

Я пытаюсь создать программу, которая отображает слово и позволяет пользователю попытаться произнести то, что отображается на экране, в качестве введения в произношение и словарный запас. Язык, с которым я работаю, – тайский, но примеры здесь будут на английском языке.
Некоторые основные отправные точки я нашел в репозитории GitHub (https://github.com/PyThaiNLP/). pythaiasr), который я смог использовать для прогнозирования произносимых мной предложений. Он основан на существующих моделях, таких как этот набор данных HuggingFace. Я не знаю, работает ли он, используя словарь слов или комбинируя фонемы для создания слов.
В любом случае, как я могу заставить его прогнозировать (и получать уровни достоверности) на основе определенный набор слов/фраз? Всего их будет 44, по одной на каждую согласную в алфавите.
Например, в английской программе могут быть «фразы»:

[code][b ball, k car, d dog, f fish, j jelly, l lemon, m moon, ...][/code]

И не распознает эти примеры путаницы:

[code][b car, d fish, l dog, m ball, ...][/code]
Предположим, что слова уже существуют в языке.
Я немного новичок в искусственном интеллекте и нейронных сетях в целом, но если кто-то может указать мне на метод или структуру, я смогу взять их оттуда. Спасибо! 

Подробнее здесь: [url]https://stackoverflow.com/questions/78748133/how-can-i-force-or-retrain-a-language-model-to-predict-using-specific-words-phra[/url]