Я работаю с новыми API-интерфейсами распознавания речи в iOS 17 и столкнулся с некоторой путаницей в отношении использования URL-адресов в SFSpeechLanguageModel.prepareCustomLanguageModel и SFSpeechLanguageModel.Configuration.
В SFSpeechLanguageModel .Инициализатор конфигурации, я предоставляю URL-адрес, указывающий на .bin-файл пользовательской языковой модели. Однако в методе подготовитьCustomLanguageModel также есть параметр URL. Мне неясно назначение этого второго URL-адреса и чем он отличается от URL-адреса в конфигурации.
Что еще больше запутывает, документация для этих новых API не полностью детализирована. в этот момент. Я попытался внедрить оба файла .bin (для пользовательской языковой модели и для подготовкиCustomLanguageModel) в один и тот же URL-адрес, но результаты не прояснили их отдельные роли.
В экспериментах Я провел, проверил уровень достоверности распознанных фраз из одного и того же аудиофайла с файлом пользовательской языковой модели .bin и без него. Удивительно, но уровни достоверности остались одинаковыми в обоих сценариях, что заставило меня задаться вопросом, правильно ли используется пользовательская модель.
Кто-нибудь еще работал с этими новыми API и может прояснить следующие вопросы:
Различные роли URL-адресов в SFSpeechLanguageModel.Configuration и подготовитьCustomLanguageModel.
Почему при использовании пользовательской языковой модели может не быть заметной разницы в уровнях достоверности.
Любая Мы будем очень признательны за идеи или опыт работы с этими новыми аспектами API распознавания речи iOS 17.
Подробнее здесь: https://stackoverflow.com/questions/778 ... l-vs-confi
URL-адреса в новом API распознавания речи iOS 17: подготовитьCustomLanguageModel против URL-адреса конфигурации ⇐ IOS
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Ошибка перезагрузки многопроцессорной обработки распознавания речи Vosk
Anonymous » » в форуме Python - 0 Ответы
- 112 Просмотры
-
Последнее сообщение Anonymous
-