Как оптимизировать асинхронное загрузку видео на S3 Python? - Цифровое Кемерово

Как оптимизировать асинхронное загрузку видео на S3 Python? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как оптимизировать асинхронное загрузку видео на S3 Python?

Цитата

Сообщение Anonymous » 12 июн 2025, 20:24

Я делаю запросы на различные конечные точки API, которые содержат большие файлы MP4 (> 100 МБ) и хочу заполнить их до ведра S3. Я заключил это как задачу ввода/вывода из -за обработки запросов API + потоковую передачу видеоконтента для загрузки, поэтому я решил использовать асинхронное программирование. Моя текущая реализация кода не достаточно эффективна, когда дело доходит до загрузки на S3. Как я подошел к этому, сначала итерация над каждым куском видео, а затем загрузила все это (как показано в коде ниже), но понял, что это заняло несколько минут на видео. Затем я пробовал загрузить каждый итерационный кусок, похожий на эту реализацию, но не видел никаких улучшений. Я почти уверен, что это проблема с тем, как я обращаюсь с каждой частью видеопотока, но не нашел много решений, чтобы помочь. Я могу загрузить видео в свой локальный каталог с каждым видео, показывающим и обработка по задачам, но я заметил на S3, похоже, что видео обрабатываются по одному. Является ли AIOBOTO3 правильным решением асинхронно записать видеофайлы в S3? Это проблема с тем, как я использую aioboto3 < /code> с асинхронным программированием?
Это пример кода: < /p>
import asyncio
import httpx
from botocore.exceptions import ClientError
import aioboto3
from boto3.s3.transfer import TransferConfig
from typing import AsyncIterator
import io

async def async_upload(stream: AsyncIterator[bytes],
destination_key: str,
config: TransferConfig) -> None:
"""
Asynchronously uploads video files via `aioboto3`

Args:
stream (AsyncIterator[bytes]): The video stream broken up into iterable chunks
destination_key (str): The desired destination for the video file
config (TransferConfig): Configuration for using threading
"""

session = aioboto3.Session()

async with session.client('s3') as s3:
buffer = io.BytesIO()
async for chunk in stream:
buffer.write(chunk)

buffer.seek(0)
await s3.upload_fileobj(buffer, bucket_name, destination_key, Config=config)

async def upload_video():
# Example url
url = 'https://api.example.com/somevideo.mp4'

async with httpx.AsyncClient(timeout=httpx.Timeout(20, read=10)) as request:
# Stream to lazily load to memory for faster times
async with request.stream("GET", url) as response:
if response.status_code == 200:
try:
s3_key = f'{folder_name}/{file_name}'
config = TransferConfig(use_threads=True)
await async_upload(response.aiter_bytes(chunk_size=100*1024*1024), s3_key, config) # 100MB chunks

except ClientError as e:
print('Upload Failed', e)
else:
print('Bad Response', response.status_code)

if __name__ == '__main__':

bucket_name = 'Test-Bucket'
folder_name = 'Test'
file_name = 'Video.MP4'

asyncio.run(upload_video())

Подробнее здесь: https://stackoverflow.com/questions/796 ... -s3-python

Реклама

1749749087

Anonymous

 Я делаю запросы на различные конечные точки API, которые содержат большие файлы MP4 (> 100 МБ) и хочу заполнить их до ведра S3. Я заключил это как задачу ввода/вывода из -за обработки запросов API + потоковую передачу видеоконтента для загрузки, поэтому я решил использовать асинхронное программирование. Моя текущая реализация кода не достаточно эффективна, когда дело доходит до загрузки на S3. Как я подошел к этому, сначала итерация над каждым куском видео, а затем загрузила все это (как показано в коде ниже), но понял, что это заняло несколько минут на видео. Затем я пробовал загрузить каждый итерационный кусок, похожий на эту реализацию, но не видел никаких улучшений. Я почти уверен, что это проблема с тем, как я обращаюсь с каждой частью видеопотока, но не нашел много решений, чтобы помочь. Я могу загрузить видео в свой локальный каталог с каждым видео, показывающим и обработка по задачам, но я заметил на S3, похоже, что видео обрабатываются по одному. Является ли AIOBOTO3  правильным решением асинхронно записать видеофайлы в S3? Это проблема с тем, как я использую aioboto3 < /code> с асинхронным программированием?
Это пример кода: < /p>
import asyncio
import httpx
from botocore.exceptions import ClientError
import aioboto3
from boto3.s3.transfer import TransferConfig
from typing import AsyncIterator
import io

async def async_upload(stream: AsyncIterator[bytes],
destination_key: str,
config: TransferConfig) -> None:
"""
Asynchronously uploads video files via `aioboto3`

Args:
stream (AsyncIterator[bytes]): The video stream broken up into iterable chunks
destination_key (str): The desired destination for the video file
config (TransferConfig): Configuration for using threading
"""

session = aioboto3.Session()

async with session.client('s3') as s3:
buffer = io.BytesIO()
async for chunk in stream:
buffer.write(chunk)

buffer.seek(0)
await s3.upload_fileobj(buffer, bucket_name, destination_key, Config=config)

async def upload_video():
# Example url
url = 'https://api.example.com/somevideo.mp4'

async with httpx.AsyncClient(timeout=httpx.Timeout(20, read=10)) as request:
# Stream to lazily load to memory for faster times
async with request.stream("GET", url) as response:
if response.status_code == 200:
try:
s3_key = f'{folder_name}/{file_name}'
config = TransferConfig(use_threads=True)
await async_upload(response.aiter_bytes(chunk_size=100*1024*1024), s3_key, config) # 100MB chunks

except ClientError as e:
print('Upload Failed', e)
else:
print('Bad Response', response.status_code)

if __name__ == '__main__':

bucket_name = 'Test-Bucket'
folder_name = 'Test'
file_name = 'Video.MP4'

asyncio.run(upload_video())
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79663910/how-to-optimize-asynchronous-video-upload-to-s3-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как оптимизировать асинхронное загрузку видео на S3 Python?

Последнее сообщение Anonymous « 13 июн 2025, 00:05
Добавлено в форуме Python

Anonymous » 13 июн 2025, 00:05 » в форуме Python

Я делаю запросы на различные конечные точки API, которые содержат большие файлы MP4 (> 100 МБ) и хочу заполнить их до ведра S3. Я заключил это как задачу ввода/вывода из -за обработки запросов API + потоковую передачу видеоконтента для загрузки,...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
13 июн 2025, 00:05
Как оптимизировать асинхронное загрузку видео на S3 Python?

Последнее сообщение Anonymous « 13 июн 2025, 05:18
Добавлено в форуме Python

Anonymous » 13 июн 2025, 05:18 » в форуме Python

Я делаю запросы на различные конечные точки API, которые содержат большие файлы MP4 (> 100 МБ) и хочу заполнить их до ведра S3. Я заключил это как задачу ввода/вывода из -за обработки запросов API + потоковую передачу видеоконтента для загрузки,...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
13 июн 2025, 05:18
Я пытаюсь загрузить видео с помощью API, но не удалось начать загрузку видео.

Последнее сообщение Anonymous « 10 мар 2024, 06:48
Добавлено в форуме Python

Anonymous » 10 мар 2024, 06:48 » в форуме Python

Ошибка:

Не удалось начать загрузку видео. Код состояния: 403
Содержимое ответа: b'{ error :{ message : (#200) У субъекта нет разрешения публиковать видео по этой цели , type : OAuthException , code :200, fbtrace_id : AnjF6t8q7LwHZ7QkOWSg8_O }}'
Не...

0 Ответы

79 Просмотры

Последнее сообщение Anonymous
10 мар 2024, 06:48
Как оптимизировать загрузку журналов из API в Laravel?

Последнее сообщение Anonymous « 19 апр 2024, 22:14
Добавлено в форуме Php

Anonymous » 19 апр 2024, 22:14 » в форуме Php

Кода у меня пока нет, но по сути это загрузка записей в несколько таблиц в базе данных. Для этого будет использоваться задача cron.
В этой загрузке записей каждая запись имеет свой API для персонализированной информации, поэтому нужно будет посетить...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
19 апр 2024, 22:14
Как оптимизировать загрузку журналов из API в Laravel?

Последнее сообщение Anonymous « 20 апр 2024, 09:09
Добавлено в форуме Php

Anonymous » 20 апр 2024, 09:09 » в форуме Php

Кода у меня пока нет, но по сути это загрузка записей в несколько таблиц в базе данных. Для этого будет использоваться задача cron.
В этой загрузке записей каждая запись имеет свой API для персонализированной информации, поэтому нужно будет посетить...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
20 апр 2024, 09:09

Вернуться в «Python»

Programmiererforum