Имейте большой df-фрейм данных, который выглядит следующим образом (список в столбце «SKU»)
Код: Выделить всё
| SKU | Count | Percent
|----------------------------------------------------------------------|-------|-------------|
| "('000000009100000749',)" | 110 | 0.029633621 |
| "('000000009100000749', '000000009100000776')" | 1 | 0.000269397 |
| "('000000009100000749', '000000009100000776', '000000009100002260')" | 1 | 0.000269397 |
| "('000000009100000749', '000000009100000777', '000000009100002260')" | 1 | 0.000269397 |
| "('000000009100000749', '000000009100000777', '000000009100002530')" | 1 | 0.000269397 |
skus str
код i64
000000009100000749
1
000000009100000785
2
000000009100002088
3
Я пробовал этот код:
Код: Выделить всё
replacements = pl.col("SKU")
for old, new in df_unique.items():
replacements = replacements.str.replace_all(old, new)
df = df.select(replacements)
SchemaError: Серия dtype: List(Utf8) != Utf8
Я попытался изменить значения столбца на строку, хотя считаю, что это избыточно, но та же ошибка
Код: Выделить всё
df= df.with_column(
pl.col('SKU').apply(lambda row: [str(x) for x in row])
)
Подробнее здесь: https://stackoverflow.com/questions/750 ... values-fro