Я создал ноутбук DataBrciks и загружаю таблицу в DataBricks, используя код Pyspark, [введите описание изображения здесь] [1], [введите описание изображения здесь] [1], и я пытаюсь скопировать недостающую информацию STORE_ID с предыдущего месяца до текущего месяца с историческими и настоящими данными. Ниже примеры таблицы.
Если в таблице майских данных store_ids 300001, 300003 и 300005 отсутствуют, их полные данные и все связанные исторические данные следует копировать из данных предыдущего месяца в текущую таблицу данных май. С помощью логической группы по типу, категории, бренда, сегмента и метода сбора фиксируется. < /P>
Как я могу написать код для логики. Я ожидал от результатов, подобного этому. [Введите описание изображения здесь] [1], пожалуйста, определите store_ids, отсутствующий в отчете текущего месяца, и копируйте их соответствующие исторические данные, применяя групповую логику для типа, категории, бренда и сегмента, чтобы создать полную таблицу. Проверка, проверка выше прикрепленных изображений. p>.
Подробнее здесь: https://stackoverflow.com/questions/796 ... heir-store
Как гарантировать, что записи store_id отсутствуют в настоящем месяце получить свои записи Store_id за прошедший месяц ( ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Средние расходы клиентов в каждом месяце и количество заказанных товаров в каждом месяце.
Anonymous » » в форуме JAVA - 0 Ответы
- 36 Просмотры
-
Последнее сообщение Anonymous
-