Цель — создать программу, которая отображает слово и позволяет пользователю попытаться произнести то, что отображается на экране, в качестве введения в произношение и словарный запас. Язык, с которым я работаю, — тайский, но примеры здесь будут на английском языке. В этом репозитории GitHub (
https://github.com/PyThaiNLP/pythaiasr) я нашел некоторые основные отправные точки, которые я смог использовать для прогнозирования произносимых мной предложений. Он основан на таких существующих моделях (набор данных HuggingFace). Я не знаю, работает ли это при использовании словаря слов или при объединении фонем для создания слов. В любом случае, как я могу заставить его прогнозировать (и получать уровни достоверности) на основе определенного набора слов/фраз? Всего их будет 44, по одной на каждую согласную в алфавите.
Например, в английской программе могут быть «фразы»:
Код: Выделить всё
[b ball, k car, d dog, f fish, j jelly, l lemon, m moon, ...]
И не распознает эти примеры путаницы:
Предположим, что слова уже существуют в языке. Я немного новичок в искусственном интеллекте и нейронных сетях в целом, но если кто-то может указать мне на метод или структуру, я смогу взять его оттуда. Спасибо!
Подробнее здесь:
https://stackoverflow.com/questions/787 ... words-phra