Я имею данные о данных с неполными значениями, как показано ниже - в частности, с соответствующими годами, и я хотел бы сделать его квадратным (то есть все три cust_id, чтобы правильно вменять значения для возраста за все три года, то есть я хочу повернуть это: < /p>
Я знаю, что могу итеративно создать новые данные DataFrames, а затем присоединиться или сдвинуть значения, и потенциально использовать Apply и/или eval_map, но я надеялся найти что -то быстрое и идиоматическое для поляров. Заранее спасибо за помощь!
Я имею данные о данных с неполными значениями, как показано ниже - в частности, с соответствующими годами, и я хотел бы сделать его квадратным (то есть все три cust_id, чтобы правильно вменять значения для возраста за все три года, то есть я хочу повернуть это: < /p> [code]df = pl.DataFrame({ "cust_id": [1, 2 ,2, 2, 3, 3], "year": [2000,1999,2000,2001,1999,2001], "cust_age": [21,31,32,33,44,46]
}) [/code] Я знаю, что могу итеративно создать новые данные DataFrames, а затем присоединиться или сдвинуть значения, и потенциально использовать Apply и/или eval_map, но я надеялся найти что -то быстрое и идиоматическое для поляров. Заранее спасибо за помощь!
Я знаю, что вменение пропущенных значений — это именно то, что звучит, я говорю о вменении его средним значением столбца. Обычно я вменяю пропущенные значения перед тем, как разделить данные на обучение и тестирование, но потом я увидел этот QnA, в...
Обновление:
см. В этом посте, где используется потоковой механизм:
Как убедиться, что плагин по выражению поляра правильно использует несколько процессоров? ( для вычисления тяжелых вычислений. Я мог видеть большой и задержка в том, чтобы сделать...