Как зациклить список таблиц, содержащих бизнес-ключ, и передать его методу для выполнения обработки данных? - Цифровое Кемерово

Как зациклить список таблиц, содержащих бизнес-ключ, и передать его методу для выполнения обработки данных? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как зациклить список таблиц, содержащих бизнес-ключ, и передать его методу для выполнения обработки данных?

Цитата

Сообщение Anonymous » 14 июл 2024, 09:12

Мы выполняем проверку данных, чтобы передать исходную таблицу для имен представлений SQL, например TEST_SCH.VIEWNAME, и целевое дельта-представление datalake для Schema.deltaview, чтобы сравнить тестирование количества строк столбца. Таким образом, нам нужно написать множество сценариев для выполнения.
У меня есть общие сценарии, в которых мне нужно освоить исходную и целевую таблицу для передачи отдельных сценариев - тогда мой сценарий должен выполнить все исходные и целевые представления. В обоих представлениях мы передаем общий бизнес-ключ для сортировки окончательных сравниваемых данных и подтверждения отсутствия различий в данных.
Ниже приведены сценарии, которые мы используем в настоящее время, но которые оптимизируют и один скрипт для передачи списка названий исходного и целевого представления с подробностями бизнес-столбца.
Пример текущих скриптов для нас прямо сейчас:

Код: Выделить всё

%run "/SQLSERVER/TEST_ConnectionInfo"

Код: Выделить всё

table_name = "[TEST].[SQL_TABLE_VIEW]"
source = spark.read \
.format("jdbc") \
.option("url", jdbcUrl) \
.option("dbtable", table_name) \
.option("databaseName", database_name) \
.option("accessToken", access_token) \
.option("encrypt", "true") \
.option("hostNameInCertificate", "*.database.windows.net") \
.load()
source.createOrReplaceTempView("source_view")

Код: Выделить всё

df = spark.sql(f"""select * from target.deltatableviewname""")
df.createOrReplaceTempView("target")

Код: Выделить всё

Source=spark.sql('select * from source_view')
Target=spark.sql('select * from target')

Первый уровень проверки источника и количества целей должен соответствовать нашим сценариям.
Ниже одна концепция AB и BA с операцией с данными источник-цель:< /p>

Код: Выделить всё

from pyspark.sql.functions import *
df_DataFromsrcDiff=Source.subtract(target).withColumn("Source", lit("A"))
df_DataFromtargetDiff=target.subtract(Source).withColumn("Target", lit("B"))

Код: Выделить всё

from pyspark.sql.functions import col
difference=df_DataFromtargetDiff.union(df_DataFromsrcDiff)
difference=diffdatadf.sort(col("businesskey for column"))

Код: Выделить всё

print(difference.count()) -- should give 0 count

Конечным результатом будет только 0, если 0, то при сравнении данных обоих представлений нет разницы.
Как нам получить список представлений и бизнес-ключ передается в один скрипт для выполнения проверки данных?
Просьба предоставить решение для одного сценария для выполнения приведенного выше кода для управления моей проверкой данных. Убедитесь, что в каждое представление мы должны передать один или несколько бизнес-ключей для сортировки окончательных различий в данных, поэтому, пожалуйста, помогите нам.

Подробнее здесь: https://stackoverflow.com/questions/787 ... to-execute

Реклама

1720937558

Anonymous

Мы выполняем проверку данных, чтобы передать исходную таблицу для имен представлений SQL, например TEST_SCH.VIEWNAME, и целевое дельта-представление datalake для Schema.deltaview, чтобы сравнить тестирование количества строк столбца. Таким образом, нам нужно написать множество сценариев для выполнения.
У меня есть общие сценарии, в которых мне нужно освоить исходную и целевую таблицу для передачи отдельных сценариев - тогда мой сценарий должен выполнить все исходные и целевые представления. В обоих представлениях мы передаем общий бизнес-ключ для сортировки окончательных сравниваемых данных и подтверждения отсутствия различий в данных.
Ниже приведены сценарии, которые мы используем в настоящее время, но которые оптимизируют и один скрипт для передачи списка названий исходного и целевого представления с подробностями бизнес-столбца.
Пример текущих скриптов для нас прямо сейчас:
[code]%run "/SQLSERVER/TEST_ConnectionInfo"
[/code]
[code]table_name = "[TEST].[SQL_TABLE_VIEW]"
source = spark.read \
.format("jdbc") \
.option("url", jdbcUrl) \
.option("dbtable", table_name) \
.option("databaseName", database_name) \
.option("accessToken", access_token) \
.option("encrypt", "true") \
.option("hostNameInCertificate", "*.database.windows.net") \
.load()
source.createOrReplaceTempView("source_view")
[/code]
[code]df = spark.sql(f"""select * from target.deltatableviewname""")
df.createOrReplaceTempView("target")
[/code]
[code]Source=spark.sql('select * from source_view')
Target=spark.sql('select * from target')
[/code]
Первый уровень проверки источника и количества целей должен соответствовать нашим сценариям.
Ниже одна концепция AB и BA с операцией с данными источник-цель:< /p>
[code]from pyspark.sql.functions import *
df_DataFromsrcDiff=Source.subtract(target).withColumn("Source", lit("A"))
df_DataFromtargetDiff=target.subtract(Source).withColumn("Target", lit("B"))
[/code]
[code]from pyspark.sql.functions import col
difference=df_DataFromtargetDiff.union(df_DataFromsrcDiff)
difference=diffdatadf.sort(col("businesskey for column"))
[/code]
[code]print(difference.count()) -- should give 0 count
[/code]
Конечным результатом будет только 0, если 0, то при сравнении данных обоих представлений нет разницы.
Как нам получить список представлений и бизнес-ключ передается в один скрипт для выполнения проверки данных?
Просьба предоставить решение для одного сценария для выполнения приведенного выше кода для управления моей проверкой данных. Убедитесь, что в каждое представление мы должны передать один или несколько бизнес-ключей для сортировки окончательных различий в данных, поэтому, пожалуйста, помогите нам. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78736990/how-to-looping-the-list-of-table-contain-business-key-pass-to-method-to-execute[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как создать несколько бизнес-объектов внутри одного бизнес-объекта в XAF?

Последнее сообщение Anonymous « 23 июл 2024, 11:45
Добавлено в форуме C#

Anonymous » 23 июл 2024, 11:45 » в форуме C#

Итак, вот чего я пытаюсь достичь:
Я пытаюсь создать так называемую документацию быстрого производства, которая включает в себя несколько элементов, созданных с помощью одной и той же карты. код> . Пример:
LOGICALREF | NAME | MAINPRODREF (Id of the...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
23 июл 2024, 11:45
Как создать несколько бизнес-объектов внутри одного бизнес-объекта в XAF?

Последнее сообщение Anonymous « 24 июл 2024, 11:37
Добавлено в форуме C#

Anonymous » 24 июл 2024, 11:37 » в форуме C#

Итак, вот чего я пытаюсь достичь:
Я пытаюсь создать так называемую документацию быстрого производства, которая включает в себя несколько элементов, созданных с помощью одной и той же карты. код> . Пример:
LOGICALREF | NAME | MAINPRODREF (Id of the...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
24 июл 2024, 11:37
Динамическое изменение порядка вложенных циклов, содержащих бизнес-логику, в Python

Последнее сообщение Anonymous « 12 апр 2024, 00:35
Добавлено в форуме Python

Anonymous » 12 апр 2024, 00:35 » в форуме Python

Я разрабатываю сценарий для кампании по использованию лабораторного оборудования. Инструмент, с которым мы работаем, принимает различные параметры, такие как координаты X и Y, мощность, задержка, импульс и т. д.
Один из важнейших аспектов операции...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
12 апр 2024, 00:35
Как подсчитать строки в другой таблице, содержащей внешний ключ, и зациклить ее для каждого экземпляра коллекции?

Последнее сообщение Anonymous « 05 дек 2024, 06:04
Добавлено в форуме Php

Anonymous » 05 дек 2024, 06:04 » в форуме Php

У меня есть две таблицы, которые связаны друг с другом.
Их структура выглядит следующим образом.

modul_table

идентификатор | идентификатор_пользователя | титул | слизняк | платформа

lecture_table

id | идентификатор_пользователя |...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
05 дек 2024, 06:04
Thymeleaf – Как зациклить список по индексу

Последнее сообщение Anonymous « 04 янв 2024, 20:51
Добавлено в форуме JAVA

Anonymous » 04 янв 2024, 20:51 » в форуме JAVA

Как выполнить цикл по индексу?

Foo.java

public Foo { частные задачи List; ... } index.html

Задачи:

Я получил ошибку анализа
org.thymeleaf.Exceptions.TemplateProcessingException: не удалось проанализировать каждое из них: «${index:...

0 Ответы

37 Просмотры

Последнее сообщение Anonymous
04 янв 2024, 20:51

Вернуться в «Python»

Programmiererforum