Какой наиболее эффективный способ потоковой передачи данных на S3 с помощью aioboto3? - Цифровое Кемерово

Какой наиболее эффективный способ потоковой передачи данных на S3 с помощью aioboto3? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Какой наиболее эффективный способ потоковой передачи данных на S3 с помощью aioboto3?

Цитата

Сообщение Anonymous » 07 ноя 2024, 01:28

Я пытаюсь реализовать настоящее решение потоковой передачи из API в S3 с помощью aioboto3. Поток данных:

Извлечение данных из API с использованием разбиения на страницы (каждая страница возвращает N элементов).
Потоковая передача каждого элемента. непосредственно на S3.
Окончательный файл должен быть сжат (в настоящее время с использованием gzip) и в формате JSON.

Мой текущий подход использует put_object, который требует создания всего содержимого в памяти:

Код: Выделить всё

async with session.client('s3') as s3:
await s3.put_object(
Bucket=bucket,
Key=key,
Body=json_content,  # This holds everything in memory
ContentType='application/json',
ContentEncoding='gzip'
)

Я ожидаю, что нечто подобное возможно:

Код: Выделить всё

async def fetch_data() -> AsyncIterator[dict]:
"""Fetch paginated data from API."""
while has_more_pages:
items = await fetch_page()
for item in items:
yield item

async def stream_to_s3():
async with s3.client() as client:
# Some streaming method that handles compression
await client.stream_to_s3(
data_stream=fetch_data(),
bucket=bucket,
key=key,
compression='gzip'
)

Я вижу, что в aioboto3 есть функция upload_fileobj и возможность многочастной загрузки, но я не уверен, какой наиболее эффективный способ добиться настоящей потоковой передачи без буферизации всего в памяти.
Каково состояние? Современный подход к потоковой передаче данных на S3 с использованием aioboto3? Размер данных может составлять от нескольких КБ до нескольких ГБ.

Подробнее здесь: https://stackoverflow.com/questions/791 ... g-aioboto3

Реклама

1730932123

Anonymous

Я пытаюсь реализовать настоящее решение потоковой передачи из API в S3 с помощью aioboto3. Поток данных:
[list]
[*]Извлечение данных из API с использованием разбиения на страницы (каждая страница возвращает N элементов).
[*]Потоковая передача каждого элемента. непосредственно на S3.
[*]Окончательный файл должен быть сжат (в настоящее время с использованием gzip) и в формате JSON.
[/list]
Мой текущий подход использует put_object, который требует создания всего содержимого в памяти:
[code]async with session.client('s3') as s3:
await s3.put_object(
Bucket=bucket,
Key=key,
Body=json_content,  # This holds everything in memory
ContentType='application/json',
ContentEncoding='gzip'
)
[/code]
Я ожидаю, что нечто подобное возможно:
[code]async def fetch_data() -> AsyncIterator[dict]:
"""Fetch paginated data from API."""
while has_more_pages:
items = await fetch_page()
for item in items:
yield item

async def stream_to_s3():
async with s3.client() as client:
# Some streaming method that handles compression
await client.stream_to_s3(
data_stream=fetch_data(),
bucket=bucket,
key=key,
compression='gzip'
)
[/code]
Я вижу, что в aioboto3 есть функция upload_fileobj и возможность многочастной загрузки, но я не уверен, какой наиболее эффективный способ добиться настоящей потоковой передачи без буферизации всего в памяти.
Каково состояние? Современный подход к потоковой передаче данных на S3 с использованием aioboto3? Размер данных может составлять от нескольких КБ до нескольких ГБ.
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79164471/whats-the-most-efficient-way-to-stream-data-to-s3-using-aioboto3[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Эффективный способ потоковой передачи веб-камеры с клиента на сервер C#

Последнее сообщение Anonymous « 29 май 2024, 12:55
Добавлено в форуме C#

Anonymous » 29 май 2024, 12:55 » в форуме C#

Я установил собственное TCP-соединение между моим клиентом и сервером.
Я делаю простую программу чата. Пока пользователи могут общаться друг с другом и отправлять файлы.
Я добавляю чат через веб-камеру и использую AForge.Net для захвата кадров с...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
29 май 2024, 12:55
Использование PipeStream для передачи потока ответов для ведения журнала без потери эффекта потоковой передачи для конеч

Последнее сообщение Anonymous « 03 май 2024, 06:06
Добавлено в форуме C#

Anonymous » 03 май 2024, 06:06 » в форуме C#

У меня есть конечная точка, которая передает List как IAsyncEnumerable в ответе, и поэтому при использовании в браузере ответ загружается с эффектом потоковой передачи по мере записи данных в поток ответа.
Теперь у меня также есть сквозное...

0 Ответы

90 Просмотры

Последнее сообщение Anonymous
03 май 2024, 06:06
Загрузка большого файла с s3 с помощью aioboto3 и aiofiles происходит очень медленно.

Последнее сообщение Anonymous « 24 сен 2024, 10:22
Добавлено в форуме Python

Anonymous » 24 сен 2024, 10:22 » в форуме Python

У меня высоконагруженная система, в которую многие пользователи могут загружать большие файлы (+1 ГБ).
Иногда после загрузки мне нужно загрузить их с S3, чтобы вычислить некоторую метаинформацию.
В настоящее время я для этого я использую этот код...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
24 сен 2024, 10:22
Загрузка большого файла с s3 с помощью aioboto3 и aiofiles происходит очень медленно.

Последнее сообщение Anonymous « 25 сен 2024, 14:14
Добавлено в форуме Python

Anonymous » 25 сен 2024, 14:14 » в форуме Python

У меня высоконагруженная система, в которую многие пользователи могут загружать большие файлы (+1 ГБ).
Иногда после загрузки мне нужно загрузить их с S3, чтобы вычислить некоторую метаинформацию.
В настоящее время я для этого я использую этот код...

0 Ответы

50 Просмотры

Последнее сообщение Anonymous
25 сен 2024, 14:14
Мне нужен способ потоковой передачи живого видео с моего компьютера на устройство Android с помощью Python.

Последнее сообщение Anonymous « 29 сен 2024, 00:24
Добавлено в форуме Python

Anonymous » 29 сен 2024, 00:24 » в форуме Python

Итак, я создал графический интерфейс с использованием TKinter, который автоматически обновляется при обнаружении определенного материала на экране компьютера. Мне нужен способ перенести этот обновляемый графический интерфейс на устройство Android,...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
29 сен 2024, 00:24

Вернуться в «Python»

Programmiererforum