Я специально пытаюсь создать приложение, которое может запустить файл HTML-Javascript, который может распознавать речевой ввод из микрофона, транскрибировать его и назначать динамик, пока я не нажимаю на остановку. Спикер, хотя я также установил конфигурацию для дневника.
Speech Sample
Speech Recognition Speech SDK not found
(microsoft.cognitiveservices.speech.sdk.bundle.js missing).
Microsoft Cognitive Services Speech SDK
Javascript Browser Sample
Subscription:
Region:
West US
West US 2
East US
East US 2
East Asia
South East Asia
Central India
North Europe
West Europe
Recognition language:
English - US
Start
Stop
Results:
Events:
function Initialize(onComplete) {
if (!!window.SpeechSDK) {
document.getElementById('content').style.display = 'block';
document.getElementById('warning').style.display = 'none';
onComplete(window.SpeechSDK);
}
}
var SpeechSDK;
var phraseDiv, statusDiv;
var key, authorizationToken;
var regionOptions;
var recognizer;
document.addEventListener("DOMContentLoaded", function () {
scenarioStartButton = document.getElementById('scenarioStartButton');
scenarioStopButton = document.getElementById('scenarioStopButton');
phraseDiv = document.getElementById("phraseDiv");
statusDiv = document.getElementById("statusDiv");
key = document.getElementById("key");
regionOptions = document.getElementById("regionOptions");
scenarioStartButton.addEventListener("click", function () {
doContinuousRecognition();
});
scenarioStopButton.addEventListener("click", function() {
if (recognizer) {
recognizer.stopContinuousRecognitionAsync();
}
});
});
function getAudioConfig() {
return SpeechSDK.AudioConfig.fromDefaultMicrophoneInput();
}
function getSpeechConfig() {
var speechConfig = SpeechSDK.SpeechConfig.fromSubscription(key.value, regionOptions.value);
speechConfig.setProperty(SpeechSDK.PropertyId.SpeechServiceConnection_EnableSpeakerDiarization, "true"); // Enable speaker diarization
console.log("Speaker diarization enabled."); // Log confirmation
return speechConfig;
}
function onRecognized(sender, recognitionEventArgs) {
var result = recognitionEventArgs.result;
console.log(result); // Log the entire result for debugging
phraseDiv.scrollTop = phraseDiv.scrollHeight;
var speakerId = result.speakerId ? ` [Speaker ID: ${result.speakerId}]` : '';
statusDiv.innerHTML += `(recognized) Reason: ${SpeechSDK.ResultReason[result.reason]}`;
phraseDiv.innerHTML += `${result.text}${speakerId}\r\n`;
}
function doContinuousRecognition() {
var audioConfig = getAudioConfig();
var speechConfig = getSpeechConfig();
if (!audioConfig || !speechConfig) return;
recognizer = new SpeechSDK.SpeechRecognizer(speechConfig, audioConfig);
recognizer.recognized = onRecognized;
recognizer.startContinuousRecognitionAsync();
}
Initialize(async function (speechSdk) {
SpeechSDK = speechSdk;
});
Подробнее здесь: https://stackoverflow.com/questions/794 ... audio-real
Попытка создать программу речевой программы Azure, которая может транскрибировать и дневнизировать аудио в режиме реальн ⇐ Javascript
Форум по Javascript
1741637063
Anonymous
Я специально пытаюсь создать приложение, которое может запустить файл HTML-Javascript, который может распознавать речевой ввод из микрофона, транскрибировать его и назначать динамик, пока я не нажимаю на остановку. Спикер, хотя я также установил конфигурацию для дневника.[b]
Speech Sample
Speech Recognition Speech SDK not found
(microsoft.cognitiveservices.speech.sdk.bundle.js missing).
Microsoft Cognitive Services Speech SDK
Javascript Browser Sample
[url=https://www.microsoft.com/cognitive-services/sign-up]Subscription[/url]:
Region:
West US
West US 2
East US
East US 2
East Asia
South East Asia
Central India
North Europe
West Europe
Recognition language:
English - US
[/b]
Start
Stop
Results:
Events:
function Initialize(onComplete) {
if (!!window.SpeechSDK) {
document.getElementById('content').style.display = 'block';
document.getElementById('warning').style.display = 'none';
onComplete(window.SpeechSDK);
}
}
var SpeechSDK;
var phraseDiv, statusDiv;
var key, authorizationToken;
var regionOptions;
var recognizer;
document.addEventListener("DOMContentLoaded", function () {
scenarioStartButton = document.getElementById('scenarioStartButton');
scenarioStopButton = document.getElementById('scenarioStopButton');
phraseDiv = document.getElementById("phraseDiv");
statusDiv = document.getElementById("statusDiv");
key = document.getElementById("key");
regionOptions = document.getElementById("regionOptions");
scenarioStartButton.addEventListener("click", function () {
doContinuousRecognition();
});
scenarioStopButton.addEventListener("click", function() {
if (recognizer) {
recognizer.stopContinuousRecognitionAsync();
}
});
});
function getAudioConfig() {
return SpeechSDK.AudioConfig.fromDefaultMicrophoneInput();
}
function getSpeechConfig() {
var speechConfig = SpeechSDK.SpeechConfig.fromSubscription(key.value, regionOptions.value);
speechConfig.setProperty(SpeechSDK.PropertyId.SpeechServiceConnection_EnableSpeakerDiarization, "true"); // Enable speaker diarization
console.log("Speaker diarization enabled."); // Log confirmation
return speechConfig;
}
function onRecognized(sender, recognitionEventArgs) {
var result = recognitionEventArgs.result;
console.log(result); // Log the entire result for debugging
phraseDiv.scrollTop = phraseDiv.scrollHeight;
var speakerId = result.speakerId ? ` [Speaker ID: ${result.speakerId}]` : '';
statusDiv.innerHTML += `(recognized) Reason: ${SpeechSDK.ResultReason[result.reason]}`;
phraseDiv.innerHTML += `${result.text}${speakerId}\r\n`;
}
function doContinuousRecognition() {
var audioConfig = getAudioConfig();
var speechConfig = getSpeechConfig();
if (!audioConfig || !speechConfig) return;
recognizer = new SpeechSDK.SpeechRecognizer(speechConfig, audioConfig);
recognizer.recognized = onRecognized;
recognizer.startContinuousRecognitionAsync();
}
Initialize(async function (speechSdk) {
SpeechSDK = speechSdk;
});
Подробнее здесь: [url]https://stackoverflow.com/questions/79499068/trying-to-build-azure-speech-program-that-can-transcribe-and-diarize-audio-real[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия