Я знаю, что существуют сторонние библиотеки, которые могут читать PDF-файлы, но, учитывая, что в них есть изображения и другая важная информация PDF-файл, было бы лучше, если бы в такую модель, как GPT 4 Turbo, был загружен фактический PDF-файл напрямую.
Я изложу свой вариант использования, чтобы добавить больше контекста. Я собираюсь сделать RAG. В приведенном ниже коде я обрабатываю PDF-файл и приглашение. Обычно я добавляю текст в конце приглашения. Я все равно могу сделать это с PDF-файлом, если извлеку его содержимое вручную.
Следующий код взят отсюда https://platform.openai.com/docs/assistants/tools/code -устный переводчик. Я так должен это делать?
Код: Выделить всё
# Upload a file with an "assistants" purpose
file = client.files.create(
file=open("example.pdf", "rb"),
purpose='assistants'
)
# Create an assistant using the file ID
assistant = client.beta.assistants.create(
instructions="You are a personal math tutor. When asked a math question, write and run code to answer the question.",
model="gpt-4-1106-preview",
tools=[{"type": "code_interpreter"}],
file_ids=[file.id]
)
Подробнее здесь: https://stackoverflow.com/questions/774 ... -apis-gpts
Мобильная версия