Могу ли я изменить значение NULL для столбца в моем фрейме данных Spark? - Цифровое Кемерово

Могу ли я изменить значение NULL для столбца в моем фрейме данных Spark? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Могу ли я изменить значение NULL для столбца в моем фрейме данных Spark?

Цитата

Сообщение Anonymous » 21 ноя 2025, 11:36

У меня есть StructField в кадре данных, который не имеет значения NULL. Простой пример:

Код: Выделить всё

import pyspark.sql.functions as F
from pyspark.sql.types import *
l = [('Alice', 1)]
df = sqlContext.createDataFrame(l, ['name', 'age'])
df = df.withColumn('foo', F.when(df['name'].isNull(),False).otherwise(True))
df.schema.fields

который возвращает:

[StructField(name,StringType,true),
StructField(age,LongType,true),
StructField(foo,BooleanType,false)]

Уведомление что поле foo не имеет значения NULL. Проблема в том, что (по причинам, в которые я не буду вдаваться) я хочу, чтобы оно допускало значение NULL. Я нашел этот пост «Изменить свойство столбца, допускающее значение null, в Spark DataFrame», в котором предлагался способ сделать это, поэтому я адаптировал приведенный в нем код к следующему:

Код: Выделить всё

import pyspark.sql.functions as F
from pyspark.sql.types import *
l = [('Alice', 1)]
df = sqlContext.createDataFrame(l, ['name', 'age'])
df = df.withColumn('foo', F.when(df['name'].isNull(),False).otherwise(True))
df.schema.fields
newSchema = [StructField('name',StringType(),True), StructField('age',LongType(),True),StructField('foo',BooleanType(),False)]
df2 = sqlContext.createDataFrame(df.rdd, newSchema)

что не удалось:

TypeError: StructField(name,StringType,true) не является сериализуемым JSON

Я также вижу это в трассировке стека:

raise ValueError("Циркулярная ссылка обнаружено")

Так что я немного застрял. Может ли кто-нибудь изменить этот пример таким образом, чтобы я мог определить фрейм данных, в котором столбец foo имеет значение NULL?

Подробнее здесь: https://stackoverflow.com/questions/460 ... -dataframe

1763714197

Anonymous

У меня есть StructField в кадре данных, который не имеет значения NULL. Простой пример:

[code]import pyspark.sql.functions as F
from pyspark.sql.types import *
l = [('Alice', 1)]
df = sqlContext.createDataFrame(l, ['name', 'age'])
df = df.withColumn('foo', F.when(df['name'].isNull(),False).otherwise(True))
df.schema.fields
[/code]

который возвращает:


[StructField(name,StringType,true),
StructField(age,LongType,true),
StructField(foo,BooleanType,false)]


Уведомление что поле foo не имеет значения NULL. Проблема в том, что (по причинам, в которые я не буду вдаваться) я хочу, чтобы оно допускало значение NULL. Я нашел этот пост «Изменить свойство столбца, допускающее значение null, в Spark DataFrame», в котором предлагался способ сделать это, поэтому я адаптировал приведенный в нем код к следующему:

[code]import pyspark.sql.functions as F
from pyspark.sql.types import *
l = [('Alice', 1)]
df = sqlContext.createDataFrame(l, ['name', 'age'])
df = df.withColumn('foo', F.when(df['name'].isNull(),False).otherwise(True))
df.schema.fields
newSchema = [StructField('name',StringType(),True), StructField('age',LongType(),True),StructField('foo',BooleanType(),False)]
df2 = sqlContext.createDataFrame(df.rdd, newSchema)
[/code]

что не удалось:


TypeError: StructField(name,StringType,true) не является сериализуемым JSON


Я также вижу это в трассировке стека:


raise ValueError("Циркулярная ссылка обнаружено")


Так что я немного застрял. Может ли кто-нибудь изменить этот пример таким образом, чтобы я мог определить фрейм данных, в котором столбец foo имеет значение NULL? 

Подробнее здесь: [url]https://stackoverflow.com/questions/46072411/can-i-change-the-nullability-of-a-column-in-my-spark-dataframe[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»