Извлечение текста PDF с использованием PDFKIT и Vision OCR

Извлечение текста PDF с использованием PDFKIT и Vision OCR ⇐ IOS

1 сообщение • Страница 1 из 1

Anonymous

Извлечение текста PDF с использованием PDFKIT и Vision OCR

Сообщение Anonymous » 02 июл 2025, 19:35

Я уже давно пытался сделать это право. У меня есть одностраничные PDF -файлы, которые передаются с .fileimporter в качестве URL. Эти PDF являются очень простыми структурированными, типизированными текстами в упорядоченных таблицах:

Мне нужно добавить все текст, но основной, что есть в таблице. Есть так много сайтов, которые говорят, чтобы сделать такие вещи, чтобы получить текст PDF: < /p>
func extractText(from url: URL, appSettings: SettingsStorage) {
guard let document = PDFDocument(url: url),
let page = document.page(at: 0) else {
print("Fail")
return
}
if let structuredText = page.string {
print(structuredText)
}
}
< /code>
Да, это извлекает текст, но он ни в коем случае не структурирован. И да, я знаю, что в формате PDF нет «структуры». Это, конечно, потребует преобразования PDF в изображение. Это то, что я делаю в отношении этого: < /p>
func convertPDFToImage(url: URL) -> UIImage? {
guard let pdfDocument = PDFDocument(url: url) else {
return nil
}
if let pdfPage = pdfDocument.page(at: 0) {
let pdfPageSize = pdfPage.bounds(for: .mediaBox)
let renderer = UIGraphicsImageRenderer(size: pdfPageSize.size)

let image = renderer.image { ctx in
UIColor.lightText.set()
ctx.fill(pdfPageSize)
ctx.cgContext.translateBy(x: 0.0, y: pdfPageSize.size.height)
ctx.cgContext.scaleBy(x: 1.0, y: -1.0)

pdfPage.draw(with: .mediaBox, to: ctx.cgContext)
}
return image
} else {
return nil
}
}
< /code>
Это дает мне несовершенное изображение. Я пытался масштабировать, чтобы улучшить качество и т. Д., Но не исправляется. Может быть, этот способ устарел? func getConvertPDFAndGetText(url: URL) {
if let image = convertPDFToImage(url: url) {
guard let cgImage = image.cgImage else { return }
let handler = VNImageRequestHandler(cgImage: cgImage, options: [:])
let request = VNRecognizeTextRequest { request, error in
if let observations = request.results as? [VNRecognizedTextObservation] {
let topCandidates: [String] = observations.map { observation in
observation.topCandidates(1).first?.string ?? ""
}
print(topCandidates.joined(separator: " "))
}
}
do {
try handler.perform([request])
} catch {
print("error")
}
}
}
< /code>
Я не знаю, неправильно ли мое обращение в изображение или мое распознавание текста неправильно. Кто -нибудь может помочь мне здесь? Это было бесчисленное количество часов, пытаясь заставить это работать достаточно хорошо, чтобы поместить в производство.

Подробнее здесь: https://stackoverflow.com/questions/796 ... vision-ocr

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «IOS»