Как прочитать большой текстовый файл в Amazon SageMaker? - Цифровое Кемерово

Как прочитать большой текстовый файл в Amazon SageMaker? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Гость

Как прочитать большой текстовый файл в Amazon SageMaker?

Цитата

Сообщение Гость » 29 окт 2023, 10:38

Я хочу прочитать несколько текстовых файлов из корзины s3, которые составят фрейм данных из 10 миллионов записей и 900 столбцов. Но чтение данных с использованием экземпляра ml.p3.2xlarge занимает слишком много времени. Более того, я хотел бы знать, есть ли лучший способ чтения данных со всеми ресурсами, доступными в большом экземпляре aws.

Ниже приведен код, который я использую прямо сейчас.
def get_data(prefix_objs = prefix_objs, Bucket = Bucket, i = 0, prefix_df = [], cols = col): для объекта в prefix_objs: я += 1 ключ = объект.ключ file_path = 's3://' + Bucket.name +'/'+str(ключ) temp = pd.read_csv(путь_файла, сентябрь = "|", usecols = столбец) print("Номер файла: {}".format(i)) prefix_df.append(температура) вернуть pd.concat(prefix_df)

1698565095

Гость


Я хочу прочитать несколько текстовых файлов из корзины s3, которые составят фрейм данных из 10 миллионов записей и 900 столбцов. Но чтение данных с использованием экземпляра ml.p3.2xlarge занимает слишком много времени. Более того, я хотел бы знать, есть ли лучший способ чтения данных со всеми ресурсами, доступными в большом экземпляре aws.
 
Ниже приведен код, который я использую прямо сейчас.
 def get_data(prefix_objs = prefix_objs, Bucket = Bucket, i = 0, prefix_df = [], cols = col):     для объекта в prefix_objs:         я += 1         ключ = объект.ключ         file_path = 's3://' + Bucket.name +'/'+str(ключ)         temp = pd.read_csv(путь_файла,                           сентябрь = "|",                           usecols = столбец)         print("Номер файла: {}".format(i))         prefix_df.append(температура)     вернуть pd.concat(prefix_df)

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»

Programmiererforum