Как я могу заставить или переобучить языковую модель для прогнозирования с использованием определенных слов/фраз? - Цифровое Кемерово

Как я могу заставить или переобучить языковую модель для прогнозирования с использованием определенных слов/фраз? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Как я могу заставить или переобучить языковую модель для прогнозирования с использованием определенных слов/фраз?

Цитата

Сообщение Anonymous » 15 июл 2024, 08:08

Цель — создать программу, которая отображает слово и позволяет пользователю попытаться произнести то, что отображается на экране, в качестве введения в произношение и словарный запас. Язык, с которым я работаю, — тайский, но примеры здесь будут на английском языке. В этом репозитории GitHub (https://github.com/PyThaiNLP/pythaiasr) я нашел некоторые основные отправные точки, которые я смог использовать для прогнозирования произносимых мной предложений. Он основан на таких существующих моделях (набор данных HuggingFace). Я не знаю, работает ли это при использовании словаря слов или при объединении фонем для создания слов. В любом случае, как я могу заставить его прогнозировать (и получать уровни достоверности) на основе определенного набора слов/фраз? Всего их будет 44, по одной на каждую согласную в алфавите.
Например, в английской программе могут быть «фразы»:

Код: Выделить всё

[b ball, k car, d dog, f fish, j jelly, l lemon, m moon, ...]

И не распознает эти примеры путаницы:

Код: Выделить всё

[b car, d fish, l dog, m ball, ...]

Предположим, что слова уже существуют в языке. Я немного новичок в искусственном интеллекте и нейронных сетях в целом, но если кто-то может указать мне на метод или структуру, я смогу взять его оттуда. Спасибо!

Подробнее здесь: https://stackoverflow.com/questions/787 ... words-phra

1721020104

Anonymous

Цель — создать программу, которая отображает слово и позволяет пользователю попытаться произнести то, что отображается на экране, в качестве введения в произношение и словарный запас. Язык, с которым я работаю, — тайский, но примеры здесь будут на английском языке. В этом репозитории GitHub (https://github.com/PyThaiNLP/pythaiasr) я нашел некоторые основные отправные точки, которые я смог использовать для прогнозирования произносимых мной предложений. Он основан на таких существующих моделях (набор данных HuggingFace). Я не знаю, работает ли это при использовании словаря слов или при объединении фонем для создания слов. В любом случае, как я могу заставить его прогнозировать (и получать уровни достоверности) на основе определенного набора слов/фраз? Всего их будет 44, по одной на каждую согласную в алфавите.
Например, в английской программе могут быть «фразы»:

[code][b ball, k car, d dog, f fish, j jelly, l lemon, m moon, ...][/code]

И не распознает эти примеры путаницы:

[code][b car, d fish, l dog, m ball, ...][/code]
Предположим, что слова уже существуют в языке. Я немного новичок в искусственном интеллекте и нейронных сетях в целом, но если кто-то может указать мне на метод или структуру, я смогу взять его оттуда. Спасибо! 

Подробнее здесь: [url]https://stackoverflow.com/questions/78748133/how-can-i-force-or-retrain-a-language-model-to-predict-using-specific-words-phra[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»

Programmiererforum