Некоторые основные отправные точки я нашел в репозитории GitHub (https://github.com/PyThaiNLP/). pythaiasr), который я смог использовать для прогнозирования произносимых мной предложений. Он основан на существующих моделях, таких как этот набор данных HuggingFace. Я не знаю, работает ли он, используя словарь слов или комбинируя фонемы для создания слов.
В любом случае, как я могу заставить его прогнозировать (и получать уровни достоверности) на основе определенный набор слов/фраз? Всего их будет 44, по одной на каждую согласную в алфавите.
Например, в английской программе могут быть «фразы»:
Код: Выделить всё
[b ball, k car, d dog, f fish, j jelly, l lemon, m moon, ...]
Код: Выделить всё
[b car, d fish, l dog, m ball, ...]
Я немного новичок в искусственном интеллекте и нейронных сетях в целом, но если кто-то может указать мне на метод или структуру, я смогу взять их оттуда. Спасибо!
Подробнее здесь: https://stackoverflow.com/questions/787 ... words-phra