Как я могу обработать PDF-файл с помощью API OpenAI (GPT)?Python

Программы на Python
Ответить
Anonymous
 Как я могу обработать PDF-файл с помощью API OpenAI (GPT)?

Сообщение Anonymous »

Веб-интерфейс ChatGPT позволяет легко загружать PDF-файлы. Существует ли API openAI, который может получать PDF-файлы?
Я знаю, что существуют сторонние библиотеки, которые могут читать PDF-файлы, но, учитывая, что в них есть изображения и другая важная информация PDF-файл, было бы лучше, если бы в такую ​​модель, как GPT 4 Turbo, был загружен фактический PDF-файл напрямую.
Я изложу свой вариант использования, чтобы добавить больше контекста. Я собираюсь сделать RAG. В приведенном ниже коде я обрабатываю PDF-файл и приглашение. Обычно я добавляю текст в конце приглашения. Я все равно могу сделать это с PDF-файлом, если извлеку его содержимое вручную.
Следующий код взят отсюда https://platform.openai.com/docs/assistants/tools/code -устный переводчик. Я так должен это делать?

Код: Выделить всё

# Upload a file with an "assistants" purpose
file = client.files.create(
file=open("example.pdf", "rb"),
purpose='assistants'
)

# Create an assistant using the file ID
assistant = client.beta.assistants.create(
instructions="You are a personal math tutor. When asked a math question, write and run code to answer the question.",
model="gpt-4-1106-preview",
tools=[{"type": "code_interpreter"}],
file_ids=[file.id]
)
Существует также конечная точка загрузки, но, похоже, эти конечные точки предназначены для тонкой настройки и помощников. Я думаю, что вариант использования RAG является обычным и не обязательно связан с помощниками.


Подробнее здесь: https://stackoverflow.com/questions/774 ... -apis-gpts
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»