Проблема: Этот сценарий вызывает две основные проблемы:
- Процесс консолидации вручную в Excel медленный и подвержен ошибкам.
- При подключении Power BI напрямую к этим электронным таблицам для создания отчетов производительность снижается. очень плохой, а обновления занимают слишком много времени.
Мои технические вопросы:
- Импорт (ETL): Каков рекомендуемый подход для регулярного перемещения данных из нескольких таблиц Excel в базу данных SQL? Лучше ли использовать SSIS, сценарии Python (с pandas) или собственные потоки данных Power BI?
- Моделирование: Должен ли я просто реплицировать структуру своей электронной таблицы в SQL (одна «огромная таблица» на каждую таблицу) или необходимо нормализовать данные (например, создать таблицы измерений для плана счетов, центров затрат, и т. д., а также таблицу фактов для записей)?
- Соединение (Power BI): Как только данные будут в SQL, какой режим подключения Power BI обеспечит наилучшую производительность для отчетов финансового контроля: Импорт (импорт данных в PBI) или DirectQuery (запрос к базе данных в режиме реального времени)?
- Выбор СУБД (база данных): Учитывая мой профиль (новичок в SQL), нашу среду (корпоративную, в настоящее время на базе Windows/Excel) и цель (производительность Power BI), каковы ключевые технические факторы при выборе между PostgreSQL (бесплатно) и MySQL? Есть ли явные преимущества интеграции Power BI между собой?
Подробнее здесь: https://stackoverflow.com/questions/798 ... files-to-a