В речевой структуре Apple - это время SFTranscriptionSegment, которое должно быть выключено, и речевое определение MetaDIOS

Программируем под IOS
Ответить
Anonymous
 В речевой структуре Apple - это время SFTranscriptionSegment, которое должно быть выключено, и речевое определение MetaD

Сообщение Anonymous »

Я работаю в Swift/Swiftui, запускаю Xcode 16.3 на MacOS 15.4, и я видел это при запуске в симуляторе iOS и в приложении MacOS, запущенном из XCode. Я также видел это поведение с 3 различными аудиофайлами.
Ничто в документации не говорит о том, что свойство SpeecheRecognitionMetAdata на sfspeechRecognitionresult будет ноль , пока не остановил мой класс>, но это поведение, которое я вижу.

Код: Выделить всё

class SimplestTranscriber {
private var isAuthed = false

// I call this in a .task {} in my SwiftUI View
public func requestSpeechRecognizerPermission() {
SFSpeechRecognizer.requestAuthorization { authStatus in
Task {
self.isAuthed = authStatus == .authorized
}
}
}

public func transcribe(from url: URL) {
guard isAuthed else { return }

let locale = Locale(identifier: "en-US")
let recognizer = SFSpeechRecognizer(locale: locale)
let recognitionRequest = SFSpeechURLRecognitionRequest(url: url)

// the behaviour occurs whether I set this to true or not, I recently set
// it to true to see if it made a difference
recognizer?.supportsOnDeviceRecognition = true
recognitionRequest.shouldReportPartialResults = true
recognitionRequest.addsPunctuation = true

recognizer?.recognitionTask(with: recognitionRequest) { (result, error) in
guard result != nil else { return }

if result!.isFinal {
//speechRecognitionMetadata is not nil
} else {
//speechRecognitionMetadata is nil
}
}
}
}
Далее, и это также не задокументировано, значения sftranscriptionSegment не имеют правильного временного метки и продолжительности значения до ISfinal . Значения не все нулевые, но они не совпадают с временем в аудио, и они изменяются на точные значения, когда ISfinal true.
Транскрипция иначе «работает», в том, что я получаю текст транскрипции до Isfinal и если я жду Isfinal , сегменты являются правильными и речевыми ичинными

Подробнее здесь: https://stackoverflow.com/questions/796 ... -to-be-off
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «IOS»