Я создаю прототип обнаружения мошенничества в реальном времени как для [b]голосовых вызовов[/b], так и для [b]текстовых чатов[/b]. [list] [*]Голосовой ввод будет расшифровываться с использованием потокового ASR, а затем классифицироваться с помощью NLP.
[*]Ввод текста будет классифицироваться напрямую.
[*]Система должна выводить [b]оценка риска[/b] и выделение подозрительных фраз (например, срочность, запросы OTP/паролей, выдача себя за другое лицо).
[*]Он должен работать с [b]низкой задержкой на мобильных устройствах или периферийных устройствах[/b], поэтому размер модели и стоимость вывода имеют значение.
[/list] В настоящее время я выбираю между: [list] [*]ключевые слова на основе правил,
[*]облегченный классификатор-трансформер,
[*]или гибридный подход.
[/list] Вопросы: [list] [*]Какие функции помимо ключевых слов эффективны для обнаружения мошенничества в беседах?
[*]Какие упрощенные модели подходят для классификации текста на устройстве в реальном времени?
[*]Для потоковой передачи голосовых расшифровок следует ли классифицировать по скользящим окнам или по полным высказываниям?
[*]Какая конструкция конвейера лучше всего сочетает задержку и точность (ASR → NLP → оценка рисков)?
[/list] Мне нужны шаблоны реализации и советы по проектированию системы, а не рекомендации по продукту.