Захват транскриптов собрания с атрибуцией динамика из Google Meet & ZoomJavascript

Форум по Javascript
Ответить
Anonymous
 Захват транскриптов собрания с атрибуцией динамика из Google Meet & Zoom

Сообщение Anonymous »

Я разрабатываю решение для автоматического получения транскриптов собрания от Google Meet и Zoom, гарантируя, что каждый сегмент отнесен к правильному динамику - подобно живым подписям, показанным во время собраний. < /p>
Моя основная цель - захватить аудио или запись данных непосредственно с этих платформ. Я попытался использовать сторонние службы речи в тексте (например, Deepgram), но они не удовлетворяли требованию для разделения динамиков. Я подозреваю, что могут быть расширения или методы браузера (возможно, перехватывают потоки WEBRTC или сами данные подписи), которые могут захватить точные транскрипты, отображаемые на интерфейсах собрания. < /P>
Я ищу руководство. ON: < /p>

[*] Методы для сбора данных в прямом эфире или аудио -потоков. < /li>
Подходы к извлечению и обработке этих данных для достижения точной транскрипции
с помощью диаризации динамика. < /li>
< /ul>
Любые указатели о том, с чего начинать, полезные библиотеки или соответствующие API -интерфейсы будут высоко оценены. Спасибо! < /P>
Примечание-не ищу стороннего API < /p>
Я попытался захватить звук от Google Meet и Zoom, используя стороннюю речь в -Text платформы, такие как deepgram , но они не соответствовали моим требованиям, особенно с точки зрения разделения динамиков . Качество транскрипции было не таким точным, как подписи, отображаемые на этих платформах. Google Meet и Zoom, с надлежащей атрибуцией динамика. Я подозреваю, что это можно сделать с помощью: < /p>
  • захват аудио -потока < /strong> с встречи. < /Li>

    li> перехват подписи
    , сгенерированные платформой (возможно, через Webrtc или Browser API).
Я заметил, что есть, по крайней мере, есть, по крайней мере одно расширение Это, кажется, достигает этого, возможно, за счет захвата звука из Zoom или Google Meet Подпись напрямую. Тем не менее, я не уверен в том, как это работает - перехватывает ли это потоки WEBRTC, чтение живых подписей или использование какого -либо другого подхода. Возможности API или браузера подключиться к этим подписям, или есть альтернативный способ извлечения их с помощью динамика.


Подробнее здесь: https://stackoverflow.com/questions/794 ... -meet-zoom
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Javascript»