Поляры для Python, могу ли я прочитать паркетные файлы с помощью hive_partitioning, когда структура и файлы каталогов бы

Поляры для Python, могу ли я прочитать паркетные файлы с помощью hive_partitioning, когда структура и файлы каталогов бы ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Поляры для Python, могу ли я прочитать паркетные файлы с помощью hive_partitioning, когда структура и файлы каталогов бы

Цитата

Сообщение Anonymous » 08 май 2025, 10:27

I вручную создал структуры каталогов и писал паркетные файлы, а не использовал параметр phyn_by в библиотеке python polars, потому что

[*] Я хочу полный контроль над файлом parquet naming
Я хочу обрабатывать файл в приплекте. Подзадачи (в моем случае я объединяю данные и дедупликации) partition_by параметр?
Спасибо

Подробнее здесь: https://stackoverflow.com/questions/796 ... n-the-dire

1746689272

Anonymous

 I вручную создал структуры каталогов и писал паркетные файлы, а не использовал параметр phyn_by  в библиотеке python polars, потому что 

[*] Я хочу полный контроль над файлом parquet naming
 Я хочу обрабатывать файл в приплекте. Подзадачи (в моем случае я объединяю данные и дедупликации) partition_by  параметр? 
Спасибо  

Подробнее здесь: [url]https://stackoverflow.com/questions/79611647/polars-for-python-can-i-read-parquet-files-with-hive-partitioning-when-the-dire[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Поляры для Python, могу ли я прочитать паркетные файлы с помощью hive_partitioning, когда структура и файлы каталогов бы

Последнее сообщение Anonymous « 08 май 2025, 13:12
Добавлено в форуме Python

Anonymous » 08 май 2025, 13:12 » в форуме Python

Я вручную создал структуры каталогов и писал паркетные файлы, а не использовал параметр phyn_by в функции write_parquet () библиотеки Python Polars, потому что

Я хочу полный контроль над файлом паркета. Подзадачи (в моем случае я объединяю данные...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
08 май 2025, 13:12
Как написать большие паркетные файлы (20 ГБ+) в SQLite на партиях, используя поляры?

Последнее сообщение Anonymous « 02 апр 2025, 12:49
Добавлено в форуме Python

Anonymous » 02 апр 2025, 12:49 » в форуме Python

У меня есть следующий код Polars, который считывает паркетный файл и записывает его в базу данных SQLite:
data = pl.scan_parquet(get_dataset_path()).collect()
_ = data.write_database(
table_name= my_table ,
connection= sqlite:///my_data.db ,...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
02 апр 2025, 12:49
Преобразование строки в массив [Int] в столбце Hive с помощью Spark или Hive

Последнее сообщение Anonymous « 28 май 2024, 23:17
Добавлено в форуме Python

Anonymous » 28 май 2024, 23:17 » в форуме Python

У меня есть образец данных в строковом формате ниже в таблице Hive
+----------------------+
| col1 |
+----------------------+
| 160-80-40 сек|
| 160-80-40 сек|
| 10-10-10-20-20-30 мин|
| 10-10-10-20-20-30 мин|
| 10-20-30-40-50-60 мин|
| 200-100-100...

0 Ответы

63 Просмотры

Последнее сообщение Anonymous
28 май 2024, 23:17
Как установить неактивное соединение Hive jdbc из Java-кода с помощью hive jdbc

Последнее сообщение Anonymous « 04 окт 2024, 06:11
Добавлено в форуме JAVA

Anonymous » 04 окт 2024, 06:11 » в форуме JAVA

Я использую hive jdbc 1.0 в своем Java-приложении для создания соединения с сервером Hive и выполнения запроса. Я хочу установить тайм-аут соединения бездействующего куста из Java-кода. Например, пользователь сначала создает соединение куста, и если...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
04 окт 2024, 06:11
Как установить Idle Hive JDBC Connection Out из кода Java с помощью Hive JDBC

Последнее сообщение Anonymous « 04 июн 2025, 07:03
Добавлено в форуме JAVA

Anonymous » 04 июн 2025, 07:03 » в форуме JAVA

Я использую Hive jdbc 1.0 в своем приложении Java для создания подключения с сервером Hive и выполнения запроса. Я хочу установить тайм -аут подключения к нему из кода Java. Например, скажем, пользователь сначала создает подключение к ульям, и если...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
04 июн 2025, 07:03

Вернуться в «Python»