Извлечение используемых и неиспользованных мер и столбцов из папок Power BI Project с использованием Python

Извлечение используемых и неиспользованных мер и столбцов из папок Power BI Project с использованием Python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Извлечение используемых и неиспользованных мер и столбцов из папок Power BI Project с использованием Python

Цитата

Сообщение Anonymous » 19 фев 2025, 00:37

Я пытаюсь создать код Python, который читает модель. Bim и Report.json из Power Bi Project, чтобы получить использование и неиспользованные меры и столбцы, для моих мыслей < /p>
столбец отмечается как «Используется», если на ссылку на: < /p>
диаграмма (из отчета.json), отношения, параметр /рассчитанная таблица, фильтр или мера
и мера отмечен как «использованный» Если на ссылку на:
a диаграмма (из отчета.json), параметр /рассчитанная таблица или ссылка на другую меру < /p>
Это то, что у меня есть, и это не отмечает меры ни столбцы вообще < /p>
import json
import pandas as pd
import os

def parse_model_bim(model_bim_path):
with open(model_bim_path, "r", encoding="utf-8") as file:
model_data = json.load(file)

tables = {}
used_columns_measures = set()

for table in model_data["model"]["tables"]:
table_name = table["name"]
table_type = "Calculated" if table.get("type") == "calculated" else "Regular"
columns = {col["name"]: col.get("isHidden", False) for col in table.get("columns", [])}
measures = {m["name"]: (m["expression"], m.get("isHidden", False)) for m in table.get("measures", [])}

tables[table_name] = {
"type": table_type,
"columns": columns,
"measures": measures,
}

if table_type == "Calculated":
used_columns_measures.update(columns.keys())
used_columns_measures.update(measures.keys())

return tables, used_columns_measures

def parse_report_json(report_json_path):
with open(report_json_path, "r", encoding="utf-8") as file:
report_data = json.load(file)

used_columns_measures = set()

for page in report_data.get("sections", []):
for visual in page.get("visualContainers", []):
if "query" in visual:
for item in visual["query"].get("Select", []):
used_columns_measures.add(item.get("Name", ""))

if "filters" in visual:
for filter_item in visual["filters"]:
used_columns_measures.add(filter_item.get("column", ""))

return used_columns_measures

def analyze_metadata(model_bim_path, report_json_path, drop_unused=False):
tables, used_in_model = parse_model_bim(model_bim_path)
used_in_report = parse_report_json(report_json_path)

used_columns_measures = used_in_model | used_in_report

table_data = []
column_data = []
measure_data = []

for table_name, table_info in tables.items():
total_columns = len(table_info["columns"])
used_columns = sum(1 for col in table_info["columns"] if col in used_columns_measures)

total_measures = len(table_info["measures"])
used_measures = sum(1 for measure in table_info["measures"] if measure in used_columns_measures)

is_unused = (used_columns + used_measures) == 0
quality_score = (used_columns + used_measures) / max(1, (total_columns + total_measures))

table_data.append([table_name, total_columns, used_columns, total_columns - used_columns,
total_measures, used_measures, total_measures - used_measures,
is_unused, table_info["type"], quality_score])

for col_name, hidden in table_info["columns"].items():
column_data.append([table_name, col_name, col_name in used_columns_measures, hidden])

for measure_name, (dax_expr, hidden) in table_info["measures"].items():
measure_data.append([table_name, measure_name, dax_expr, measure_name in used_columns_measures, hidden])

output_file = "powerbi_metadata.xlsx"
with pd.ExcelWriter(output_file) as writer:
pd.DataFrame(table_data, columns=["table_name", "total_columns", "used_columns", "unused_columns", "total_measures", "used_measures", "unused_measures", "is_unused", "table_type", "quality_score"]).to_excel(writer, sheet_name="Tables", index=False)
pd.DataFrame(column_data, columns=["table_name", "column_name", "Used", "Hidden"]).to_excel(writer, sheet_name="Columns", index=False)
pd.DataFrame(measure_data, columns=["table_name", "measure_name", "dax_expression", "Used", "Hidden"]).to_excel(writer, sheet_name="Measures", index=False)

print(f"Excel report generated: {output_file}")

if drop_unused:
with open(model_bim_path, "r", encoding="utf-8") as file:
model_data = json.load(file)

for table in model_data["model"]["tables"]:
if "measures" in table:
table["measures"] = [m for m in table["measures"] if m["name"] in used_columns_measures]

with open(model_bim_path, "w", encoding="utf-8") as file:
json.dump(model_data, file, indent=2)

print("Unused measures removed from model.bim")

# Example usage
# analyze_metadata("path/to/model.bim", "path/to/report.json", drop_unused=True)

Подробнее здесь: https://stackoverflow.com/questions/794 ... ders-using

1739914658

Anonymous

 Я пытаюсь создать код Python, который читает модель.  Bim и Report.json из Power Bi Project, чтобы получить использование и неиспользованные меры и столбцы, для моих мыслей < /p>
столбец отмечается как «Используется», если на ссылку на: < /p>
диаграмма (из отчета.json), отношения, параметр /рассчитанная таблица, фильтр или мера
и мера отмечен как «использованный» Если на ссылку на:
a диаграмма (из отчета.json), параметр /рассчитанная таблица или ссылка на другую меру < /p>
Это то, что у меня есть, и это не отмечает меры ни столбцы вообще < /p>
import json
import pandas as pd
import os

def parse_model_bim(model_bim_path):
with open(model_bim_path, "r", encoding="utf-8") as file:
model_data = json.load(file)

tables = {}
used_columns_measures = set()

for table in model_data["model"]["tables"]:
table_name = table["name"]
table_type = "Calculated" if table.get("type") == "calculated" else "Regular"
columns = {col["name"]: col.get("isHidden", False) for col in table.get("columns", [])}
measures = {m["name"]: (m["expression"], m.get("isHidden", False)) for m in table.get("measures", [])}

tables[table_name] = {
"type": table_type,
"columns": columns,
"measures": measures,
}

if table_type == "Calculated":
used_columns_measures.update(columns.keys())
used_columns_measures.update(measures.keys())

return tables, used_columns_measures

def parse_report_json(report_json_path):
with open(report_json_path, "r", encoding="utf-8") as file:
report_data = json.load(file)

used_columns_measures = set()

for page in report_data.get("sections", []):
for visual in page.get("visualContainers", []):
if "query" in visual:
for item in visual["query"].get("Select", []):
used_columns_measures.add(item.get("Name", ""))

if "filters"  in visual:
for filter_item in visual["filters"]:
used_columns_measures.add(filter_item.get("column", ""))

return used_columns_measures

def analyze_metadata(model_bim_path, report_json_path, drop_unused=False):
tables, used_in_model = parse_model_bim(model_bim_path)
used_in_report = parse_report_json(report_json_path)

used_columns_measures = used_in_model | used_in_report

table_data = []
column_data = []
measure_data = []

for table_name, table_info in tables.items():
total_columns = len(table_info["columns"])
used_columns = sum(1 for col in table_info["columns"] if col in used_columns_measures)

total_measures = len(table_info["measures"])
used_measures = sum(1 for measure in table_info["measures"] if measure in used_columns_measures)

is_unused = (used_columns + used_measures) == 0
quality_score = (used_columns + used_measures) / max(1, (total_columns + total_measures))

table_data.append([table_name, total_columns, used_columns, total_columns - used_columns,
total_measures, used_measures, total_measures - used_measures,
is_unused, table_info["type"], quality_score])

for col_name, hidden in table_info["columns"].items():
column_data.append([table_name, col_name, col_name in used_columns_measures, hidden])

for measure_name, (dax_expr, hidden) in table_info["measures"].items():
measure_data.append([table_name, measure_name, dax_expr, measure_name in used_columns_measures, hidden])

output_file = "powerbi_metadata.xlsx"
with pd.ExcelWriter(output_file) as writer:
pd.DataFrame(table_data, columns=["table_name", "total_columns", "used_columns", "unused_columns", "total_measures", "used_measures", "unused_measures", "is_unused", "table_type", "quality_score"]).to_excel(writer, sheet_name="Tables", index=False)
pd.DataFrame(column_data, columns=["table_name", "column_name", "Used", "Hidden"]).to_excel(writer, sheet_name="Columns", index=False)
pd.DataFrame(measure_data, columns=["table_name", "measure_name", "dax_expression", "Used", "Hidden"]).to_excel(writer, sheet_name="Measures", index=False)

print(f"Excel report generated: {output_file}")

if drop_unused:
with open(model_bim_path, "r", encoding="utf-8") as file:
model_data = json.load(file)

for table in model_data["model"]["tables"]:
if "measures" in table:
table["measures"] = [m for m in table["measures"] if m["name"] in used_columns_measures]

with open(model_bim_path, "w", encoding="utf-8") as file:
json.dump(model_data, file, indent=2)

print("Unused measures removed from model.bim")

# Example usage
# analyze_metadata("path/to/model.bim", "path/to/report.json", drop_unused=True)

 

Подробнее здесь: [url]https://stackoverflow.com/questions/79449671/extract-used-and-unused-measures-and-columns-from-power-bi-project-folders-using[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Project Project Project ASP.NET Project Show отсутствует и ошибки «Roslyn/Csc.exe» после открытия в Visual Studio? [закр

Последнее сообщение Anonymous « 11 июн 2025, 19:38
Добавлено в форуме C#

Anonymous » 11 июн 2025, 19:38 » в форуме C#

Я клонировал работающий проект Web.net Web Forms Targeting .net Framework 4.8 Использование Cursor (клон на основе GIT).
Я столкнулся с несколькими проблемами времени сборки и времени выполнения:

type или namepace OfficeOpenxml не может быть...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
11 июн 2025, 19:38
Неверная топология: топология не имеет потоковых потоков и никаких глобальных потоков, должна подписаться по крайней мер

Последнее сообщение Anonymous « 21 фев 2025, 13:59
Добавлено в форуме JAVA

Anonymous » 21 фев 2025, 13:59 » в форуме JAVA

Ошибка -
**
isrom resmount applicationContext. Чтобы отобразить отчет об оценке условий, повторно запустите ваше приложение с помощью «Debug». Запуск приложения не удалось
org.springframework.beans.factory.unsatisfiedDependenciesException: Ошибка...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
21 фев 2025, 13:59
Скрипт Python в Power BI (редактор Power Query)

Последнее сообщение Гость « 20 сен 2023, 17:55
Добавлено в форуме Python

Гость » 20 сен 2023, 17:55 » в форуме Python

Мне срочно нужна помощь. Не могу понять, как правильно написать скрипт.
Условие задачи

Дана таблица с различными данными, нужно найти в таблице регулярные выражения \d+\/\d{2}, после чего мне нужно удалить дубликаты.

P.s : Саму таблицу Excel...

0 Ответы

127 Просмотры

Последнее сообщение Гость
20 сен 2023, 17:55
Project Project в Project.Test/Dashboard URL -адрес

Последнее сообщение Anonymous « 01 май 2025, 18:05
Добавлено в форуме Php

Anonymous » 01 май 2025, 18:05 » в форуме Php

Я только начал учиться и практиковать Laravel недавно, но когда я пытался и создаю новый проект, я запускаю команду «NPM Run Dev», затем я открываю ссылку «Проект. Test», он приводит меня к «project.test/Dashboard», где показывает страница xampp...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
01 май 2025, 18:05
Отделение пустых папок от папок, содержащих только другие папки

Последнее сообщение Anonymous « 03 дек 2023, 04:18
Добавлено в форуме Python

Anonymous » 03 дек 2023, 04:18 » в форуме Python

У меня есть набор файлов и набор папок.

Похоже, эта часть работает:

file_folders = {p.parent для p в файлах} no_file_folders = папки - file_folders Но эта часть кажется неверной:

no_file_folders_parents = {p.parent для p в no_file_folders}...

0 Ответы

69 Просмотры

Последнее сообщение Anonymous
03 дек 2023, 04:18

Вернуться в «Python»