Как транскрибировать большой аудиофайл в приложении iOS? - Цифровое Кемерово

Как транскрибировать большой аудиофайл в приложении iOS? ⇐ IOS

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как транскрибировать большой аудиофайл в приложении iOS?

Цитата

Сообщение Anonymous » 12 фев 2025, 05:17

Я успешно использовал sfspeechRecognizer для транскрибирования небольших аудиофайлов. Но я хочу транскрибировать речь в текст из 30-минутного аудио-файла. Я придумал это решение, но оно не работает вообще. p> [Утилита] +[Afaggregator logdictationFailedWiterRor:] error domain = kafassistanterrordomain code = 203 "corpt" userinfo = {nslocalizedDescription = corpt, nsunderlyingError = 0x28315ca80 {ошибка domain = sirispeecherrord код = 102 "(null)"/pully "/null)"/Pullord pully "/null" (null) "/pull etull)
< /blockquote>

Ошибка распознавания: corpt < /p>
< /blockquote>
Код: < /< / p>
let url = Bundle.main.url(forResource: "1-2-3", withExtension: "m4a")!
let transcriber = AudioTranscriber()
transcriber.transcribeAudio(at: url)
< /code>
import Speech
import AVFoundation

class AudioTranscriber {

private let speechRecognizer: SFSpeechRecognizer?
private let audioEngine = AVAudioEngine()
private var recognitionRequest: SFSpeechAudioBufferRecognitionRequest?
private var recognitionTask: SFSpeechRecognitionTask?

init(locale: Locale? = nil) {
speechRecognizer = SFSpeechRecognizer(locale: locale ?? Locale(identifier: "uk"))
}

func transcribeAudio(at url: URL) {
if let recognitionTask = recognitionTask {
recognitionTask.cancel()
self.recognitionTask = nil
}

guard let audioFile = try? AVAudioFile(forReading: url) else {
print("Failed to open audio file")
return
}

recognitionRequest = SFSpeechAudioBufferRecognitionRequest()
guard let recognitionRequest = recognitionRequest else {
print("Unable to create recognition request")
return
}

recognitionTask = speechRecognizer?.recognitionTask(with: recognitionRequest) { result, error in
if let error = error {
print("Recognition error: \(error.localizedDescription)")
return
}

if let result = result {
let transcription = result.bestTranscription.formattedString
print("Transcription: \(transcription)")
}
}

recognitionRequest.shouldReportPartialResults = true

let audioPlayerNode = AVAudioPlayerNode()
audioEngine.attach(audioPlayerNode)

let format = audioEngine.inputNode.outputFormat(forBus: 0)

audioEngine.inputNode.removeTap(onBus: 0)

audioEngine.inputNode.installTap(onBus: 0, bufferSize: 1024, format: format) { buffer, time in
self.recognitionRequest?.append(buffer)
}

audioEngine.connect(audioPlayerNode, to: audioEngine.mainMixerNode, format: audioFile.processingFormat)

let bufferSize: AVAudioFrameCount = 1024
let buffer = AVAudioPCMBuffer(pcmFormat: audioFile.processingFormat, frameCapacity: bufferSize)!

do {
try audioFile.read(into: buffer)
} catch {
print("Error reading audio file: \(error.localizedDescription)")
return
}

audioPlayerNode.scheduleBuffer(buffer) {
print("audioPlayerNode.scheduleBuffer(buffer) completion()")
self.audioEngine.stop()
self.recognitionRequest?.endAudio()
}

audioEngine.prepare()

do {
try audioEngine.start()
} catch {
print("Audio engine failed to start: \(error.localizedDescription)")
return
}

audioPlayerNode.play()
}

}

Подробнее здесь: https://stackoverflow.com/questions/764 ... in-ios-app

Реклама

1739326646

Anonymous

 Я успешно использовал sfspeechRecognizer  для транскрибирования небольших аудиофайлов. Но я хочу транскрибировать речь в текст из 30-минутного аудио-файла. Я придумал это решение, но оно не работает вообще. p> [Утилита] +[Afaggregator logdictationFailedWiterRor:] error domain = kafassistanterrordomain code = 203 "corpt" userinfo = {nslocalizedDescription = corpt, nsunderlyingError = 0x28315ca80 {ошибка domain = sirispeecherrord код = 102 "(null)"/pully "/null)"/Pullord  pully "/null" (null) "/pull etull)
< /blockquote>

Ошибка распознавания: corpt < /p>
< /blockquote>
Код: < /< / p>
let url = Bundle.main.url(forResource: "1-2-3", withExtension: "m4a")!
let transcriber = AudioTranscriber()
transcriber.transcribeAudio(at: url)
< /code>
import Speech
import AVFoundation

class AudioTranscriber {

private let speechRecognizer: SFSpeechRecognizer?
private let audioEngine = AVAudioEngine()
private var recognitionRequest: SFSpeechAudioBufferRecognitionRequest?
private var recognitionTask: SFSpeechRecognitionTask?

init(locale: Locale? = nil) {
speechRecognizer = SFSpeechRecognizer(locale: locale ?? Locale(identifier: "uk"))
}

func transcribeAudio(at url: URL) {
if let recognitionTask = recognitionTask {
recognitionTask.cancel()
self.recognitionTask = nil
}

guard let audioFile = try? AVAudioFile(forReading: url) else {
print("Failed to open audio file")
return
}

recognitionRequest = SFSpeechAudioBufferRecognitionRequest()
guard let recognitionRequest = recognitionRequest else {
print("Unable to create recognition request")
return
}

recognitionTask = speechRecognizer?.recognitionTask(with: recognitionRequest) { result, error in
if let error = error {
print("Recognition error: \(error.localizedDescription)")
return
}

if let result = result {
let transcription = result.bestTranscription.formattedString
print("Transcription: \(transcription)")
}
}

recognitionRequest.shouldReportPartialResults = true

let audioPlayerNode = AVAudioPlayerNode()
audioEngine.attach(audioPlayerNode)

let format = audioEngine.inputNode.outputFormat(forBus: 0)

audioEngine.inputNode.removeTap(onBus: 0)

audioEngine.inputNode.installTap(onBus: 0, bufferSize: 1024, format: format) { buffer, time in
self.recognitionRequest?.append(buffer)
}

audioEngine.connect(audioPlayerNode, to: audioEngine.mainMixerNode, format: audioFile.processingFormat)

let bufferSize: AVAudioFrameCount = 1024
let buffer = AVAudioPCMBuffer(pcmFormat: audioFile.processingFormat, frameCapacity: bufferSize)!

do {
try audioFile.read(into: buffer)
} catch {
print("Error reading audio file: \(error.localizedDescription)")
return
}

audioPlayerNode.scheduleBuffer(buffer) {
print("audioPlayerNode.scheduleBuffer(buffer) completion()")
self.audioEngine.stop()
self.recognitionRequest?.endAudio()
}

audioEngine.prepare()

do {
try audioEngine.start()
} catch {
print("Audio engine failed to start: \(error.localizedDescription)")
return
}

audioPlayerNode.play()
}

}
 

Подробнее здесь: [url]https://stackoverflow.com/questions/76445624/how-do-i-transcribe-a-big-audio-file-in-ios-app[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как транскрибировать локальный аудиофайл/Blob с помощью трубопровода Transformers.js? (Ошибка json.parse)

Последнее сообщение Anonymous « 10 июл 2025, 11:47
Добавлено в форуме Javascript

Anonymous » 10 июл 2025, 11:47 » в форуме Javascript

Я работаю над приложением для аудио-транскрипции на основе браузера, используя Transformers.js от Xenova. Я пытаюсь транскрибировать файл .wav, выбранный пользователем, используя следующий код:
import { pipeline } from '@xenova/transformers';...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
10 июл 2025, 11:47
Кажется, не могу воспроизвести аудиофайл в моем приложении laravel. Я сохранил аудиофайл в локальном хранилище, когда пы

Последнее сообщение Anonymous « 01 мар 2024, 13:31
Добавлено в форуме Php

Anonymous » 01 мар 2024, 13:31 » в форуме Php

Итак, я загружаю свой mp3-файл в локальное хранилище и сохраняю путь в базе данных, поэтому, когда я получаю запись в базе данных, а также mp3-файл, похоже, что путь неправильный, поскольку я не могу его воспроизвести
>
Я запустил php artisan...

0 Ответы

80 Просмотры

Последнее сообщение Anonymous
01 мар 2024, 13:31
Kotlin MediaStore, как я могу создать аудиофайл в той же папке, что и другой отсканированный аудиофайл?

Последнее сообщение Anonymous « 19 апр 2025, 11:00
Добавлено в форуме Android

Anonymous » 19 апр 2025, 11:00 » в форуме Android

Я создаю приложение для музыкального проигрывателя, используя Android Studio в Kotlin. Я использую MediaStore, чтобы найти аудиофайлы из mediastore.adio.media.external_content_uri . Я хочу обрезать и сохранить обрезанную версию песни в том же...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
19 апр 2025, 11:00
Kotlin MediaStore, как я могу создать аудиофайл в той же папке, что и другой отсканированный аудиофайл?

Последнее сообщение Anonymous « 21 апр 2025, 07:56
Добавлено в форуме Android

Anonymous » 21 апр 2025, 07:56 » в форуме Android

Я создаю приложение для музыкального проигрывателя, используя Android Studio в Kotlin. Я использую MediaStore, чтобы найти аудиофайлы из mediastore.adio.media.external_content_uri . Я хочу обрезать и сохранить обрезанную версию песни в том же...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
21 апр 2025, 07:56
Как сегментировать и транскрибировать звук из видео в сегменты временных метков?

Последнее сообщение Anonymous « 27 янв 2025, 10:35
Добавлено в форуме Python

Anonymous » 27 янв 2025, 10:35 » в форуме Python

Я хочу сегментировать видео -транскрипт на главы на основе содержания каждой линии речи. Стенограмма будет использоваться для создания серии начальных и конечных времен для каждой главы. Это похоже на то, как YouTube теперь «Авторад» видео....

70...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
27 янв 2025, 10:35

Вернуться в «IOS»

Programmiererforum