Однако я не могу этого добиться - я что-то чиню тут и там, но безрезультатно. Мне удалось реализовать решение через чистый udf, версию без панд, но здесь — безуспешно. Имейте в виду, что image_variant_id_column имеет тип массива, что, я считаю, еще больше усложняет ситуацию. Есть ли какая-то ошибка в моем подходе? Что мне следует исправить, чтобы это прошло? Может быть, есть какой-то трюк, позволяющий вернуть такую сложную структуру?
Мне сложно написать пользовательскую функцию Pandas, которая возвращала бы сложный объект структуры. У меня есть функция со следующей сигнатурой: [code]def recipe_generator( shop_type_column: pd.Series, image_variant_id_column: pd.DataFrame, product_id_column: pd.Series, ) -> pd.DataFrame: [/code] где тип возвращаемого значения структуры примерно следующий: [code]T.StructType( [ T.StructField("url", T.StringType()), T.StructField( "devicePixelRatios", T.StructType( [ T.StructField("original", T.StringType()), T.StructField("1.5", T.StringType()), T.StructField("2.0", T.StringType()), ] ), ), T.StructField( "formats", T.StructType( [ T.StructField("thumb-75", T.StringType()), T.StructField("medium-200", T.StringType()), T.StructField("medium-360", T.StringType()), T.StructField("large-720", T.StringType()), T.StructField("original", T.StringType()), ] ), ), T.StructField("variants", T.ArrayType(T.StructType([T.StructField("id", T.StringType())]))), ] ) [/code] Однако я не могу этого добиться - я что-то чиню тут и там, но безрезультатно. Мне удалось реализовать решение через чистый udf, версию без панд, но здесь — безуспешно. Имейте в виду, что image_variant_id_column имеет тип массива, что, я считаю, еще больше усложняет ситуацию. Есть ли какая-то ошибка в моем подходе? Что мне следует исправить, чтобы это прошло? Может быть, есть какой-то трюк, позволяющий вернуть такую сложную структуру?
Мне сложно написать пользовательскую функцию Pandas, которая возвращала бы сложный объект структуры. У меня есть функция со следующей сигнатурой:
def recipe_generator(
shop_type_column: pd.Series,
image_variant_id_column: pd.DataFrame,...
Мне сложно написать пользовательскую функцию Pandas, которая возвращала бы сложный объект структуры. У меня есть функция со следующей сигнатурой:
def recipe_generator(
shop_type_column: pd.Series,
image_variant_id_column: pd.DataFrame,...
Я новичок в Pyspark, и я создал Pandas UDF. Цель этого UDF - принять серию и применить модель ML. У меня есть данные, в которых есть эти столбцы:
id, models_name, цены, units_sold, дата .....
ID - это в основном идентификатор продукта и является...