Как я могу заставить или переобучить языковую модель для прогнозирования с использованием определенных слов/фраз?Python

Программы на Python
Ответить
Anonymous
 Как я могу заставить или переобучить языковую модель для прогнозирования с использованием определенных слов/фраз?

Сообщение Anonymous »

Цель — создать программу, которая отображает слово и позволяет пользователю попытаться произнести то, что отображается на экране, в качестве введения в произношение и словарный запас. Язык, с которым я работаю, — тайский, но примеры здесь будут на английском языке. В этом репозитории GitHub (https://github.com/PyThaiNLP/pythaiasr) я нашел некоторые основные отправные точки, которые я смог использовать для прогнозирования произносимых мной предложений. Он основан на таких существующих моделях (набор данных HuggingFace). Я не знаю, работает ли это при использовании словаря слов или при объединении фонем для создания слов. В любом случае, как я могу заставить его прогнозировать (и получать уровни достоверности) на основе определенного набора слов/фраз? Всего их будет 44, по одной на каждую согласную в алфавите.
Например, в английской программе могут быть «фразы»:

Код: Выделить всё

[b ball, k car, d dog, f fish, j jelly, l lemon, m moon, ...]
И не распознает эти примеры путаницы:

Код: Выделить всё

[b car, d fish, l dog, m ball, ...]
Предположим, что слова уже существуют в языке. Я немного новичок в искусственном интеллекте и нейронных сетях в целом, но если кто-то может указать мне на метод или структуру, я смогу взять его оттуда. Спасибо!

Подробнее здесь: https://stackoverflow.com/questions/787 ... words-phra
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»