Есть ли более простой способ сделать это? У меня есть несколько столбцов, которые нужно поместить в сводную таблицу, а также в не сводную таблицу.
Я использую Databricks 14.3 LTS со Spark 3.5.0
У меня есть следующий фрейм данных. [code]df = spark.createDataFrame( [ [1, 'AB', 12, '2022-01-01'] , [1, 'AA', 22, '2022-01-10'] , [1, 'AC', 11, '2022-01-11'] , [2, 'AB', 22, '2022-02-01'] , [2, 'AA', 28, '2022-02-10'] , [2, 'AC', 25, '2022-02-22'] ] , 'code: int, doc_type: string, amount: int, load_date: string' ) df = df.withColumn('load_date', F.to_date('load_date')) [/code] Я хочу повернуть сумму, но мне нужно только первое значение даты. Это то, что я пробовал, но это не дало желаемых результатов. [code]( df.groupBy('code') .pivot('doc_type', ['AB', 'AA', 'AC']) .agg(F.sum('amount').alias('amnt'), F.first('load_date').alias('ldt')) .show() )
[/code] Есть ли более простой способ сделать это? У меня есть несколько столбцов, которые нужно поместить в сводную таблицу, а также в не сводную таблицу. Я использую Databricks 14.3 LTS со Spark 3.5.0