Захват транскриптов собрания с атрибуцией динамика из Google Meet & Zoom

Захват транскриптов собрания с атрибуцией динамика из Google Meet & Zoom ⇐ Javascript

1 сообщение • Страница 1 из 1

Anonymous

Захват транскриптов собрания с атрибуцией динамика из Google Meet & Zoom

Сообщение Anonymous » 24 фев 2025, 23:44

Я разрабатываю решение для автоматического получения транскриптов собрания от Google Meet и Zoom, гарантируя, что каждый сегмент отнесен к правильному динамику - подобно живым подписям, показанным во время собраний. 
Моя основная цель - захватить аудио или запись данных непосредственно с этих платформ. Я попытался использовать сторонние службы речи в тексте (например, Deepgram), но они не удовлетворяли требованию для разделения динамиков. Я подозреваю, что могут быть расширения или методы браузера (возможно, перехватывают потоки WEBRTC или сами данные подписи), которые могут захватить точные транскрипты, отображаемые на интерфейсах собрания. 
Я ищу руководство. ON: 

[*] Методы для сбора данных в прямом эфире или аудио -потоков. < /li>
Подходы к извлечению и обработке этих данных для достижения точной транскрипции
с помощью диаризации динамика. < /li>
< /ul>
Любые указатели о том, с чего начинать, полезные библиотеки или соответствующие API -интерфейсы будут высоко оценены. Спасибо! 
Примечание-не ищу стороннего API 
Я попытался захватить звук от Google Meet и Zoom, используя стороннюю речь в -Text платформы, такие как deepgram , но они не соответствовали моим требованиям, особенно с точки зрения разделения динамиков . Качество транскрипции было не таким точным, как подписи, отображаемые на этих платформах. Google Meet и Zoom, с надлежащей атрибуцией динамика. Я подозреваю, что это можно сделать с помощью:

захват аудио -потока с встречи. < /Li>

li> перехват подписи , сгенерированные платформой (возможно, через Webrtc или Browser API).

Я заметил, что есть, по крайней мере, есть, по крайней мере одно расширение Это, кажется, достигает этого, возможно, за счет захвата звука из Zoom или Google Meet Подпись напрямую. Тем не менее, я не уверен в том, как это работает - перехватывает ли это потоки WEBRTC, чтение живых подписей или использование какого -либо другого подхода. Возможности API или браузера подключиться к этим подписям, или есть альтернативный способ извлечения их с помощью динамика.

Подробнее здесь: https://stackoverflow.com/questions/794 ... -meet-zoom

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «Javascript»