Как транскрибировать большой аудиофайл в приложении iOS?IOS

Программируем под IOS
Ответить Пред. темаСлед. тема
Anonymous
 Как транскрибировать большой аудиофайл в приложении iOS?

Сообщение Anonymous »

Я успешно использовал sfspeechRecognizer для транскрибирования небольших аудиофайлов. Но я хочу транскрибировать речь в текст из 30-минутного аудио-файла. Я придумал это решение, но оно не работает вообще. p> [Утилита] +[Afaggregator logdictationFailedWiterRor:] error domain = kafassistanterrordomain code = 203 "corpt" userinfo = {nslocalizedDescription = corpt, nsunderlyingError = 0x28315ca80 {ошибка domain = sirispeecherrord код = 102 "(null)"/pully "/null)"/Pullord pully "/null" (null) "/pull etull)
< /blockquote>

Ошибка распознавания: corpt < /p>
< /blockquote>
Код: < /< / p>
let url = Bundle.main.url(forResource: "1-2-3", withExtension: "m4a")!
let transcriber = AudioTranscriber()
transcriber.transcribeAudio(at: url)
< /code>
import Speech
import AVFoundation

class AudioTranscriber {

private let speechRecognizer: SFSpeechRecognizer?
private let audioEngine = AVAudioEngine()
private var recognitionRequest: SFSpeechAudioBufferRecognitionRequest?
private var recognitionTask: SFSpeechRecognitionTask?

init(locale: Locale? = nil) {
speechRecognizer = SFSpeechRecognizer(locale: locale ?? Locale(identifier: "uk"))
}

func transcribeAudio(at url: URL) {
if let recognitionTask = recognitionTask {
recognitionTask.cancel()
self.recognitionTask = nil
}

guard let audioFile = try? AVAudioFile(forReading: url) else {
print("Failed to open audio file")
return
}

recognitionRequest = SFSpeechAudioBufferRecognitionRequest()
guard let recognitionRequest = recognitionRequest else {
print("Unable to create recognition request")
return
}

recognitionTask = speechRecognizer?.recognitionTask(with: recognitionRequest) { result, error in
if let error = error {
print("Recognition error: \(error.localizedDescription)")
return
}

if let result = result {
let transcription = result.bestTranscription.formattedString
print("Transcription: \(transcription)")
}
}

recognitionRequest.shouldReportPartialResults = true

let audioPlayerNode = AVAudioPlayerNode()
audioEngine.attach(audioPlayerNode)

let format = audioEngine.inputNode.outputFormat(forBus: 0)

audioEngine.inputNode.removeTap(onBus: 0)

audioEngine.inputNode.installTap(onBus: 0, bufferSize: 1024, format: format) { buffer, time in
self.recognitionRequest?.append(buffer)
}

audioEngine.connect(audioPlayerNode, to: audioEngine.mainMixerNode, format: audioFile.processingFormat)

let bufferSize: AVAudioFrameCount = 1024
let buffer = AVAudioPCMBuffer(pcmFormat: audioFile.processingFormat, frameCapacity: bufferSize)!

do {
try audioFile.read(into: buffer)
} catch {
print("Error reading audio file: \(error.localizedDescription)")
return
}

audioPlayerNode.scheduleBuffer(buffer) {
print("audioPlayerNode.scheduleBuffer(buffer) completion()")
self.audioEngine.stop()
self.recognitionRequest?.endAudio()
}

audioEngine.prepare()

do {
try audioEngine.start()
} catch {
print("Audio engine failed to start: \(error.localizedDescription)")
return
}

audioPlayerNode.play()
}

}


Подробнее здесь: https://stackoverflow.com/questions/764 ... in-ios-app
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «IOS»