DataBricks Delta Live Tables Комментарии Комментарии для созданных столбцов file_path и last_modified_date

DataBricks Delta Live Tables Комментарии Комментарии для созданных столбцов file_path и last_modified_date ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

DataBricks Delta Live Tables Комментарии Комментарии для созданных столбцов file_path и last_modified_date

Цитата

Сообщение Anonymous » 10 июн 2025, 09:59

Я вдал свою схему с < /p>

Код: Выделить всё

custom_schema = create_StructType_schema (access_key,secret_access_key,schema_bucket_name,schema_folder,schema_file_name)
metadata_fp = {"comment": "Path of the file from metadata (_metadata.file_path)"}
metadata_lmd = {"comment": "Ingestion timestamp for the current record"}

# Append fields with metadata to schema
custom_schema.add(StructField("file_path", StringType(), True, metadata_fp))
custom_schema.add(StructField("last_modified_date", TimestampType(), True, metadata_lmd))

Это хорошо работает для всех столбцов, которые не являются file_path и last_modifed_date . Но когда я пытаюсь добавить custom_schema.add Любое из строк, я получаю дубликатное предупреждение о столбце для file_path. Тем не менее, сброс любого из рядов и использование с Column теряет метаданные комментариев. Я хотел знать, был ли какой-нибудь способ получить f.current_timestamp () и _metadata.file_path с комментариями к их столбцам для таблицы Delta Live в
DataBricks

Код: Выделить всё

dfRaw=spark.readStream.format("cloudFiles").option("cloudFiles.format",file_format).option("recursiveFileLookup","true").option("cloudFiles.allowOverwrites", True).option("delimiter",file_delimiter).option("multiline","true").option("header",file_header).schema(custom_schema).load(location).select("*", "_metadata.file_path").withColumn("last_modified_date",F.current_timestamp())

Я попытался добавить Structfields в схему, сбросить столбцы и считывать их, но ничто не хранит комментарии метаданных.

Подробнее здесь: https://stackoverflow.com/questions/796 ... e-path-and

1749538767

Anonymous

 Я вдал свою схему с < /p>
[code]custom_schema = create_StructType_schema (access_key,secret_access_key,schema_bucket_name,schema_folder,schema_file_name)
metadata_fp = {"comment": "Path of the file from metadata (_metadata.file_path)"}
metadata_lmd = {"comment": "Ingestion timestamp for the current record"}

# Append fields with metadata to schema
custom_schema.add(StructField("file_path", StringType(), True, metadata_fp))
custom_schema.add(StructField("last_modified_date", TimestampType(), True, metadata_lmd))
[/code]
Это хорошо работает для всех столбцов, которые не являются file_path и last_modifed_date . Но когда я пытаюсь добавить custom_schema.add  Любое из строк, я получаю дубликатное предупреждение о столбце для file_path. Тем не менее, сброс любого из рядов и использование с Column теряет метаданные комментариев. Я хотел знать, был ли какой-нибудь способ получить f.current_timestamp ()  и _metadata.file_path  с комментариями к их столбцам для таблицы Delta Live в
DataBricks
[code]dfRaw=spark.readStream.format("cloudFiles").option("cloudFiles.format",file_format).option("recursiveFileLookup","true").option("cloudFiles.allowOverwrites", True).option("delimiter",file_delimiter).option("multiline","true").option("header",file_header).schema(custom_schema).load(location).select("*", "_metadata.file_path").withColumn("last_modified_date",F.current_timestamp())
[/code]
Я попытался добавить Structfields в схему, сбросить столбцы и считывать их, но ничто не хранит комментарии метаданных. 
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79659116/databricks-delta-live-tables-metadata-comments-for-created-columns-file-path-and[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

DataBricks Delta Live Tables Комментарии Комментарии для созданных столбцов file_path и last_modified_date

Последнее сообщение Anonymous « 09 июн 2025, 18:24
Добавлено в форуме Python

Anonymous » 09 июн 2025, 18:24 » в форуме Python

Я вдал свою схему с
custom_schema = create_StructType_schema (access_key,secret_access_key,schema_bucket_name,schema_folder,schema_file_name)
metadata_fp = { comment : Path of the file from metadata (_metadata.file_path) }
metadata_lmd = { comment...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
09 июн 2025, 18:24
DELTA LIVE TABLES – apply_changes из исходного набора данных не работает

Последнее сообщение Anonymous « 27 июн 2024, 00:51
Добавлено в форуме Python

Anonymous » 27 июн 2024, 00:51 » в форуме Python

Я использую дельта-живые таблицы в архитектуре медальонов.
У меня есть:

столбцы: идентификатор, метка времени , операция, удаленный_флаг
операции «Вставить» и «Удалить»

Когда операция «Вставить» delete_flag будет иметь значение null, а для...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
27 июн 2024, 00:51
Селектор :last vs :last-child

Последнее сообщение Anonymous « 03 авг 2024, 00:14
Добавлено в форуме Jquery

Anonymous » 03 авг 2024, 00:14 » в форуме Jquery

Я заметил, что $( 'filter:last' ) отличается от $( 'filter:last-child' ) в jQuery.

Я попробовал документацию jQuery, но мне было трудно понять, какую дополнительную цель выполняет :last и почему они оба существуют.

Очевидно, :last — это...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
03 авг 2024, 00:14
Как получить все параметры в расширенной конфигурации для конвейера Databricks Delta Live Table?

Последнее сообщение Anonymous « 06 дек 2024, 08:27
Добавлено в форуме Python

Anonymous » 06 дек 2024, 08:27 » в форуме Python

Я хотел бы получить список параметров, определенных в разделе конфигурации таблицы Delta Live

Используя язык Python для платформы Delta Live Table, если я знаю имя параметра, я могу получить его значение из конфигурации сеанса Spark, используя...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
06 дек 2024, 08:27
Как получить все параметры в расширенной конфигурации для конвейера Databricks Delta Live Table?

Последнее сообщение Anonymous « 07 дек 2024, 17:29
Добавлено в форуме Python

Anonymous » 07 дек 2024, 17:29 » в форуме Python

Я хотел бы получить список параметров, определенных в разделе конфигурации таблицы Delta Live

Используя язык Python для платформы Delta Live Table, если я знаю имя параметра, я могу получить его значение из конфигурации сеанса Spark, используя...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
07 дек 2024, 17:29

Вернуться в «Python»