Попытка создать программу речевой программы Azure, которая может транскрибировать и дневнизировать аудио в режиме реальн

Попытка создать программу речевой программы Azure, которая может транскрибировать и дневнизировать аудио в режиме реальн ⇐ Javascript

1 сообщение • Страница 1 из 1

Anonymous

Попытка создать программу речевой программы Azure, которая может транскрибировать и дневнизировать аудио в режиме реальн

Цитата

Сообщение Anonymous » 10 мар 2025, 23:04

Я специально пытаюсь создать приложение, которое может запустить файл HTML-Javascript, который может распознавать речевой ввод из микрофона, транскрибировать его и назначать динамик, пока я не нажимаю на остановку. Спикер, хотя я также установил конфигурацию для дневника.

Speech Sample

Speech Recognition Speech SDK not found
(microsoft.cognitiveservices.speech.sdk.bundle.js missing).

Microsoft Cognitive Services Speech SDK
Javascript Browser Sample

Subscription:

Region:

West US
West US 2
East US
East US 2
East Asia
South East Asia
Central India
North Europe
West Europe

Recognition language:

English - US

Start
Stop

Results:

Events:

function Initialize(onComplete) {
if (!!window.SpeechSDK) {
document.getElementById('content').style.display = 'block';
document.getElementById('warning').style.display = 'none';
onComplete(window.SpeechSDK);
}
}

var SpeechSDK;
var phraseDiv, statusDiv;
var key, authorizationToken;
var regionOptions;
var recognizer;

document.addEventListener("DOMContentLoaded", function () {
scenarioStartButton = document.getElementById('scenarioStartButton');
scenarioStopButton = document.getElementById('scenarioStopButton');
phraseDiv = document.getElementById("phraseDiv");
statusDiv = document.getElementById("statusDiv");
key = document.getElementById("key");
regionOptions = document.getElementById("regionOptions");

scenarioStartButton.addEventListener("click", function () {
doContinuousRecognition();
});

scenarioStopButton.addEventListener("click", function() {
if (recognizer) {
recognizer.stopContinuousRecognitionAsync();
}
});
});

function getAudioConfig() {
return SpeechSDK.AudioConfig.fromDefaultMicrophoneInput();
}

function getSpeechConfig() {
var speechConfig = SpeechSDK.SpeechConfig.fromSubscription(key.value, regionOptions.value);
speechConfig.setProperty(SpeechSDK.PropertyId.SpeechServiceConnection_EnableSpeakerDiarization, "true"); // Enable speaker diarization
console.log("Speaker diarization enabled."); // Log confirmation
return speechConfig;
}

function onRecognized(sender, recognitionEventArgs) {
var result = recognitionEventArgs.result;
console.log(result); // Log the entire result for debugging
phraseDiv.scrollTop = phraseDiv.scrollHeight;

var speakerId = result.speakerId ? ` [Speaker ID: ${result.speakerId}]` : '';

statusDiv.innerHTML += `(recognized) Reason: ${SpeechSDK.ResultReason[result.reason]}`;
phraseDiv.innerHTML += `${result.text}${speakerId}\r\n`;
}

function doContinuousRecognition() {
var audioConfig = getAudioConfig();
var speechConfig = getSpeechConfig();
if (!audioConfig || !speechConfig) return;

recognizer = new SpeechSDK.SpeechRecognizer(speechConfig, audioConfig);
recognizer.recognized = onRecognized;

recognizer.startContinuousRecognitionAsync();
}

Initialize(async function (speechSdk) {
SpeechSDK = speechSdk;
});

Подробнее здесь: https://stackoverflow.com/questions/794 ... audio-real

1741637063

Anonymous

 Я специально пытаюсь создать приложение, которое может запустить файл HTML-Javascript, который может распознавать речевой ввод из микрофона, транскрибировать его и назначать динамик, пока я не нажимаю на остановку.  Спикер, хотя я также установил конфигурацию для дневника.[b]


Speech Sample






Speech Recognition Speech SDK not found
(microsoft.cognitiveservices.speech.sdk.bundle.js missing).





Microsoft Cognitive Services Speech SDK
Javascript Browser Sample



[url=https://www.microsoft.com/cognitive-services/sign-up]Subscription[/url]:



Region:


West US
West US 2
East US
East US 2
East Asia
South East Asia
Central India
North Europe
West Europe




Recognition language:


English - US





[/b]

Start
Stop



Results:





Events:












function Initialize(onComplete) {
if (!!window.SpeechSDK) {
document.getElementById('content').style.display = 'block';
document.getElementById('warning').style.display = 'none';
onComplete(window.SpeechSDK);
}
}



var SpeechSDK;
var phraseDiv, statusDiv;
var key, authorizationToken;
var regionOptions;
var recognizer;

document.addEventListener("DOMContentLoaded", function () {
scenarioStartButton = document.getElementById('scenarioStartButton');
scenarioStopButton = document.getElementById('scenarioStopButton');
phraseDiv = document.getElementById("phraseDiv");
statusDiv = document.getElementById("statusDiv");
key = document.getElementById("key");
regionOptions = document.getElementById("regionOptions");

scenarioStartButton.addEventListener("click", function () {
doContinuousRecognition();
});

scenarioStopButton.addEventListener("click", function() {
if (recognizer) {
recognizer.stopContinuousRecognitionAsync();
}
});
});

function getAudioConfig() {
return SpeechSDK.AudioConfig.fromDefaultMicrophoneInput();
}

function getSpeechConfig() {
var speechConfig = SpeechSDK.SpeechConfig.fromSubscription(key.value, regionOptions.value);
speechConfig.setProperty(SpeechSDK.PropertyId.SpeechServiceConnection_EnableSpeakerDiarization, "true"); // Enable speaker diarization
console.log("Speaker diarization enabled."); // Log confirmation
return speechConfig;
}

function onRecognized(sender, recognitionEventArgs) {
var result = recognitionEventArgs.result;
console.log(result); // Log the entire result for debugging
phraseDiv.scrollTop = phraseDiv.scrollHeight;

var speakerId = result.speakerId ? ` [Speaker ID: ${result.speakerId}]` : '';

statusDiv.innerHTML += `(recognized) Reason: ${SpeechSDK.ResultReason[result.reason]}`;
phraseDiv.innerHTML += `${result.text}${speakerId}\r\n`;
}

function doContinuousRecognition() {
var audioConfig = getAudioConfig();
var speechConfig = getSpeechConfig();
if (!audioConfig || !speechConfig) return;

recognizer = new SpeechSDK.SpeechRecognizer(speechConfig, audioConfig);
recognizer.recognized = onRecognized;

recognizer.startContinuousRecognitionAsync();
}

Initialize(async function (speechSdk) {
SpeechSDK = speechSdk;
});




 

Подробнее здесь: [url]https://stackoverflow.com/questions/79499068/trying-to-build-azure-speech-program-that-can-transcribe-and-diarize-audio-real[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Есть ли способ запустить приложение, загруженное из магазина приложений, на iPhone с помощью сценария оболочки на реальн

Последнее сообщение Anonymous « 22 сен 2023, 11:28
Добавлено в форуме IOS

Anonymous » 22 сен 2023, 11:28 » в форуме IOS

Есть ли способ запустить приложение, загруженное из магазина приложений, на iPhone с помощью сценария оболочки на реальных устройствах

Попробовал запустить idevicedebug -u $DEVICE_UDID , запустить $APP_BUNDLE_ID но получаю ошибку Обязательно...

0 Ответы

88 Просмотры

Последнее сообщение Anonymous
22 сен 2023, 11:28
Есть ли способ запустить приложение, загруженное из магазина приложений, на iPhone с помощью сценария оболочки на реальн

Последнее сообщение Гость « 25 сен 2023, 13:13
Добавлено в форуме IOS

Гость » 25 сен 2023, 13:13 » в форуме IOS

Есть ли способ запустить приложение, загруженное из магазина приложений, на iPhone с помощью сценария оболочки на реальных устройствах

Попробовал запустить idevicedebug -u $DEVICE_UDID , запустить $APP_BUNDLE_ID но получаю ошибку Обязательно...

0 Ответы

94 Просмотры

Последнее сообщение Гость
25 сен 2023, 13:13
Есть ли способ запустить приложение, загруженное из магазина приложений, на iPhone с помощью сценария оболочки на реальн

Последнее сообщение Гость « 25 сен 2023, 16:24
Добавлено в форуме IOS

Гость » 25 сен 2023, 16:24 » в форуме IOS

Есть ли способ запустить приложение, загруженное из магазина приложений, на iPhone с помощью сценария оболочки на реальных устройствах

Попробовал запустить idevicedebug -u $DEVICE_UDID , запустить $APP_BUNDLE_ID но получаю ошибку Обязательно...

0 Ответы

77 Просмотры

Последнее сообщение Гость
25 сен 2023, 16:24
Можно ли создать собственный речевой пузырь без использования clip-path? [закрыто]

Последнее сообщение Anonymous « 30 июн 2024, 03:37
Добавлено в форуме CSS

Anonymous » 30 июн 2024, 03:37 » в форуме CSS

Я разрабатываю чат-бота и хотел бы создать всплывающее окно с благодарностью, используя чистый CSS.
Thanks for the heads-up! We're here to keep improving!

.hmx-thanks-balloon {
background: var(--hmx-color-light);
border-radius: 1.5rem;
bottom:...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
30 июн 2024, 03:37
Как сегментировать и транскрибировать звук из видео в сегменты временных метков?

Последнее сообщение Anonymous « 27 янв 2025, 10:35
Добавлено в форуме Python

Anonymous » 27 янв 2025, 10:35 » в форуме Python

Я хочу сегментировать видео -транскрипт на главы на основе содержания каждой линии речи. Стенограмма будет использоваться для создания серии начальных и конечных времен для каждой главы. Это похоже на то, как YouTube теперь «Авторад» видео....

70...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
27 янв 2025, 10:35

Вернуться в «Javascript»