Попытка создать программу речевой программы Azure, которая может транскрибировать и дневнизировать аудио в режиме реальнJavascript

Форум по Javascript
Ответить Пред. темаСлед. тема
Anonymous
 Попытка создать программу речевой программы Azure, которая может транскрибировать и дневнизировать аудио в режиме реальн

Сообщение Anonymous »

Я специально пытаюсь создать приложение, которое может запустить файл HTML-Javascript, который может распознавать речевой ввод из микрофона, транскрибировать его и назначать динамик, пока я не нажимаю на остановку. Спикер, хотя я также установил конфигурацию для дневника.


Speech Sample






Speech Recognition Speech SDK not found
(microsoft.cognitiveservices.speech.sdk.bundle.js missing).





Microsoft Cognitive Services Speech SDK
Javascript Browser Sample



Subscription:



Region:


West US
West US 2
East US
East US 2
East Asia
South East Asia
Central India
North Europe
West Europe




Recognition language:


English - US







Start
Stop



Results:





Events:












function Initialize(onComplete) {
if (!!window.SpeechSDK) {
document.getElementById('content').style.display = 'block';
document.getElementById('warning').style.display = 'none';
onComplete(window.SpeechSDK);
}
}



var SpeechSDK;
var phraseDiv, statusDiv;
var key, authorizationToken;
var regionOptions;
var recognizer;

document.addEventListener("DOMContentLoaded", function () {
scenarioStartButton = document.getElementById('scenarioStartButton');
scenarioStopButton = document.getElementById('scenarioStopButton');
phraseDiv = document.getElementById("phraseDiv");
statusDiv = document.getElementById("statusDiv");
key = document.getElementById("key");
regionOptions = document.getElementById("regionOptions");

scenarioStartButton.addEventListener("click", function () {
doContinuousRecognition();
});

scenarioStopButton.addEventListener("click", function() {
if (recognizer) {
recognizer.stopContinuousRecognitionAsync();
}
});
});

function getAudioConfig() {
return SpeechSDK.AudioConfig.fromDefaultMicrophoneInput();
}

function getSpeechConfig() {
var speechConfig = SpeechSDK.SpeechConfig.fromSubscription(key.value, regionOptions.value);
speechConfig.setProperty(SpeechSDK.PropertyId.SpeechServiceConnection_EnableSpeakerDiarization, "true"); // Enable speaker diarization
console.log("Speaker diarization enabled."); // Log confirmation
return speechConfig;
}

function onRecognized(sender, recognitionEventArgs) {
var result = recognitionEventArgs.result;
console.log(result); // Log the entire result for debugging
phraseDiv.scrollTop = phraseDiv.scrollHeight;

var speakerId = result.speakerId ? ` [Speaker ID: ${result.speakerId}]` : '';

statusDiv.innerHTML += `(recognized) Reason: ${SpeechSDK.ResultReason[result.reason]}`;
phraseDiv.innerHTML += `${result.text}${speakerId}\r\n`;
}

function doContinuousRecognition() {
var audioConfig = getAudioConfig();
var speechConfig = getSpeechConfig();
if (!audioConfig || !speechConfig) return;

recognizer = new SpeechSDK.SpeechRecognizer(speechConfig, audioConfig);
recognizer.recognized = onRecognized;

recognizer.startContinuousRecognitionAsync();
}

Initialize(async function (speechSdk) {
SpeechSDK = speechSdk;
});






Подробнее здесь: https://stackoverflow.com/questions/794 ... audio-real
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Javascript»