- Голосовой ввод будет расшифровываться с использованием потокового ASR, а затем классифицироваться с помощью NLP.
- Ввод текста будет классифицироваться напрямую.
- Система должна выводить оценка риска и выделение подозрительных фраз (например, срочность, запросы OTP/паролей, выдача себя за другое лицо).
- Он должен работать с низкой задержкой на мобильных устройствах или периферийных устройствах, поэтому размер модели и стоимость вывода имеют значение.
- ключевые слова на основе правил,
- облегченный классификатор-трансформер,
- или гибридный подход.
- Какие функции помимо ключевых слов эффективны для обнаружения мошенничества в беседах?
- Какие упрощенные модели подходят для классификации текста на устройстве в реальном времени?
- Для потоковой передачи голосовых расшифровок следует ли классифицировать по скользящим окнам или по полным высказываниям?
- Какая конструкция конвейера лучше всего сочетает задержку и точность (ASR → NLP → оценка рисков)?
Подробнее здесь: https://stackoverflow.com/questions/798 ... what-featu