Потоковая передача в / поднимая CSV от S3 до Python

Потоковая передача в / поднимая CSV от S3 до Python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Потоковая передача в / поднимая CSV от S3 до Python

Цитата

Сообщение Anonymous » 28 апр 2025, 21:15

Я намерен выполнить некоторые интенсивные операции памяти в очень большом файле CSV, хранящемся в S3, используя Python с намерением перенести скрипт в AWS Lambda. Я знаю, что могу прочитать во всей памяти CSV NTO, но я обязательно столкнусь с ограничениями памяти и хранения Lambda с такой большой FILEM, есть ли способ транслировать или просто читать в кусках CSV за раз в Python, используя BOTO3 /Botocore, в идеале, уделяя рецензирующие числа, чтобы прочитать? /> 1) Использование параметра диапазона в s3.get_object , чтобы указать диапазон байтов для чтения. К сожалению, это означает, что последние ряды отключаются в середине, так как нет способов указать количество рядов для чтения. это неуклюжие решения, если возможно. К сожалению, функция Row_numbers SQL не поддерживается, и не похоже, что есть способ прочитать в подмножестве строк.

Подробнее здесь: https://stackoverflow.com/questions/510 ... -to-python

1745864109

Anonymous

 Я намерен выполнить некоторые интенсивные операции памяти в очень большом файле CSV, хранящемся в S3, используя Python с намерением перенести скрипт в AWS Lambda. Я знаю, что могу прочитать во всей памяти CSV NTO, но я обязательно столкнусь с ограничениями памяти и хранения Lambda с такой большой FILEM, есть ли способ транслировать или просто читать в кусках CSV за раз в Python, используя BOTO3 /Botocore, в идеале, уделяя рецензирующие числа, чтобы прочитать? />  1) Использование параметра диапазона  в s3.get_object , чтобы указать диапазон байтов для чтения. К сожалению, это означает, что последние ряды отключаются в середине, так как нет способов указать количество рядов для чтения. это неуклюжие решения, если возможно. К сожалению, функция Row_numbers  SQL не поддерживается, и не похоже, что есть способ прочитать в подмножестве строк.  

Подробнее здесь: [url]https://stackoverflow.com/questions/51085539/streaming-in-chunking-csvs-from-s3-to-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Потоковая потоковая передача видео с камеры FLIR с помощью Python

Последнее сообщение Anonymous « 15 мар 2025, 23:05
Добавлено в форуме Python

Anonymous » 15 мар 2025, 23:05 » в форуме Python

У меня проблемы с потоковой передачей от Flir Grasshopper3 до OpenCV. Есть ли способ транслировать непосредственно от камеры FLIR в мой код с помощью Python? Когда я использую приведенный ниже код, CV.VideoCapture не может распознать камеру FLIR в...

0 Ответы

34 Просмотры

Последнее сообщение Anonymous
15 мар 2025, 23:05
Потоковая потоковая передача Polars: Parquet Parquet на основе Shift (-1)

Последнее сообщение Anonymous « 20 авг 2025, 09:32
Добавлено в форуме Python

Anonymous » 20 авг 2025, 09:32 » в форуме Python

Я пытаюсь погрузиться в большой паркетный файл с полярными. Это должно быть легко достичь в (1) памяти:
import os ; os.environ = '4'
import polars as pl
import time, random
import numpy as np
random.seed(42)

N_TICKS = 100_000
N_TICKERS = 10_000
T0...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
20 авг 2025, 09:32
Потоковая передача данных - это правильный способ создания файла CSV с использованием BytearRayoutputStream?

Последнее сообщение Anonymous « 24 янв 2025, 14:55
Добавлено в форуме JAVA

Anonymous » 24 янв 2025, 14:55 » в форуме JAVA

У меня есть этот код.
@RequestMapping( /test )
fun getData(): ResponseEntity {
val items = repository.getItems()
val outputStream = ByteArrayOutputStream()

myService.writeData(items, outputStream)
val byteArrayData = outputStream.toByteArray()...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
24 янв 2025, 14:55
Потоковая передача данных – правильный ли это способ создания файла CSV с использованием ByteArrayOutputStream?

Последнее сообщение Anonymous « 24 янв 2025, 15:37
Добавлено в форуме JAVA

Anonymous » 24 янв 2025, 15:37 » в форуме JAVA

У меня есть этот код.
@RequestMapping( /test )
fun getData(): ResponseEntity {
val items = repository.getItems()
val outputStream = ByteArrayOutputStream()

myService.writeData(items, outputStream)
val byteArrayData = outputStream.toByteArray()...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
24 янв 2025, 15:37
CSV -потоковая передача в Java выходит из строя с слишком большой полезной нагрузкой

Последнее сообщение Anonymous « 15 июн 2025, 16:31
Добавлено в форуме JAVA

Anonymous » 15 июн 2025, 16:31 » в форуме JAVA

Реализованный потоковой CSV -файл в Java Spring Boot. Текущий шлюз имеет предел отклика 10 МБ. Реализация потоковой передачи выполнена для обхода предела 10 МБ шлюза
try (CSVPrinter csvPrinter = new CSVPrinter(response.getWriter(),...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
15 июн 2025, 16:31

Вернуться в «Python»