Как я могу точно извлечь корейский текст из PDF-файлов на основе изображений для использования с LLMS? [закрыто]Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как я могу точно извлечь корейский текст из PDF-файлов на основе изображений для использования с LLMS? [закрыто]

Сообщение Anonymous »

Я студент университета в настоящее время веду проект AI (LLM) в моей школе. Моя цель - извлечь этот текст и сохранить его в векторной базе данных для использования с большой языковой моделью (LLM). Тем не менее, я сталкиваюсь с серьезными проблемами с извлечением OCR и текста. Это стало основным препятствием для интеграции обучения OCR и LLM в наш рабочий процесс обслуживания. К сожалению, результаты были либо нечитаемыми, либо полностью отсутствующей корейской поддержки персонажа.

Подробнее здесь: https://stackoverflow.com/questions/796 ... -with-llms
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»