Pyspark Maptype с Arraytype в качестве броска ключей

Pyspark Maptype с Arraytype в качестве броска ключей ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Pyspark Maptype с Arraytype в качестве броска ключей

Цитата

Сообщение Anonymous » 28 май 2025, 08:33

Я могу создать Pyspark DataFrame с столбцом Maptype, ключом которого является Arraytype. Метод Show () работает DataFrame, но метод collect () выбрасывает исключение: < /p>
> return cloudpickle.loads(obj, encoding=encoding)
E TypeError: unhashable type: 'list'
< /code>
Согласно документации Pyspark, это должно быть возможно: Maptype поддерживает ключи типа DataType и Arraytype Forheres от DataType.from pyspark.sql import SparkSession
from pyspark.sql.types import MapType, ArrayType, StringType, IntegerType

schema = MapType(ArrayType(StringType()), IntegerType())
data = [{("A", "B"): 10, ("X", "Y", "Z"): 20}]
df = spark.createDataFrame(data, schema)
df.show() # works

df.collect() # throws exception
< /code>
Примечания: < /p>

Я хочу сохранить редкие массивы в этой структуре < /li>
Я знаю, что список изменен и поэтому не может использоваться в качестве ключа в питоне.>

Подробнее здесь: https://stackoverflow.com/questions/796 ... -exception

1748410407

Anonymous

 Я могу создать Pyspark DataFrame с столбцом Maptype, ключом которого является Arraytype. Метод Show () работает DataFrame, но метод collect () выбрасывает исключение: < /p>
> return cloudpickle.loads(obj, encoding=encoding)
E TypeError: unhashable type: 'list'
< /code>
Согласно документации Pyspark, это должно быть возможно: Maptype поддерживает ключи типа DataType и Arraytype Forheres от DataType.from pyspark.sql import SparkSession
from pyspark.sql.types import MapType, ArrayType, StringType, IntegerType

schema = MapType(ArrayType(StringType()), IntegerType())
data = [{("A", "B"): 10, ("X", "Y", "Z"): 20}]
df = spark.createDataFrame(data, schema)
df.show() # works

df.collect() # throws exception
< /code>
Примечания: < /p>

 Я хочу сохранить редкие массивы в этой структуре < /li>
 Я знаю, что список изменен и поэтому не может использоваться в качестве ключа в питоне.> 

Подробнее здесь: [url]https://stackoverflow.com/questions/79613798/pyspark-maptype-with-arraytype-as-key-throws-exception[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Pyspark Maptype с Arraytype в качестве броска ключей

Последнее сообщение Anonymous « 28 май 2025, 19:08
Добавлено в форуме Python

Anonymous » 28 май 2025, 19:08 » в форуме Python

Я могу создать Pyspark DataFrame с столбцом Maptype, ключом которого является Arraytype. Метод Show () работает DataFrame, но метод collect () выбрасывает исключение:
> return cloudpickle.loads(obj, encoding=encoding)
E TypeError: unhashable type:...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
28 май 2025, 19:08
Создать DataFrame с столбцом Arraytype в pyspark

Последнее сообщение Anonymous « 16 фев 2025, 02:59
Добавлено в форуме Python

Anonymous » 16 фев 2025, 02:59 » в форуме Python

Я пытаюсь создать новый DataFrame с столбцом ArrayType () , я пытался с определением схемы и без определения, но не смог получить желаемый результат. Мой код ниже со схемой
from pyspark.sql.types import *
l = [ , , ]
schema = StructType( )
df =...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
16 фев 2025, 02:59
Pyspark Arraytype Использование в преобразовании в государство

Последнее сообщение Anonymous « 05 сен 2025, 10:36
Добавлено в форуме Python

Anonymous » 05 сен 2025, 10:36 » в форуме Python

У меня есть следующий код Python, который использует Pyspark для издевания системы обнаружения мошенничества для кредитных карт:
from pyspark.sql import SparkSession
from pyspark.sql.functions import from_json, col, unix_timestamp
from...

0 Ответы

1 Просмотры

Последнее сообщение Anonymous
05 сен 2025, 10:36
Pyspark Arraytype Использование в преобразовании в государство

Последнее сообщение Гость « 05 сен 2025, 12:54
Добавлено в форуме Python

Гость » 05 сен 2025, 12:54 » в форуме Python

У меня есть следующий код Python, который использует Pyspark для издевания системы обнаружения мошенничества для кредитных карт:
from pyspark.sql import SparkSession
from pyspark.sql.functions import from_json, col, unix_timestamp
from...

0 Ответы

1 Просмотры

Последнее сообщение Гость
05 сен 2025, 12:54
Pyspark Arraytype Использование в преобразовании в государство

Последнее сообщение Anonymous « 10 сен 2025, 09:21
Добавлено в форуме Python

Anonymous » 10 сен 2025, 09:21 » в форуме Python

У меня есть следующий код Python, который использует Pyspark для издевания системы обнаружения мошенничества для кредитных карт:
from pyspark.sql import SparkSession
from pyspark.sql.functions import from_json, col, unix_timestamp
from...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
10 сен 2025, 09:21

Вернуться в «Python»