Влияет ли преобразование RDD в DataFrame и Back разделы или структуру данных внутри раздела в Spark?Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Влияет ли преобразование RDD в DataFrame и Back разделы или структуру данных внутри раздела в Spark?

Сообщение Anonymous »

Я экспериментирую с Spark и хочу прояснить, как ведет ведение разделения при преобразовании между RDD и DataFrames.

Код: Выделить всё

rdd1 = sc.parallelize([("a",1), ("b",2), ("c",3), ("d",4)], 4)
print(rdd1.glom().collect())
# Output: [[('a', 1)], [('b', 2)], [('c', 3)], [('d', 4)]]

df = rdd1.toDF(["letter", "freq"])
print(df.collect())
# Output: [Row(letter='a', freq=1),
#          Row(letter='b', freq=2),
#          Row(letter='c', freq=3),
#          Row(letter='d', freq=4)]

rdd2 = df.rdd
print(rdd2.glom().collect())
# Output: [[Row(letter='a', freq=1)],
#          [Row(letter='b', freq=2)],
#          [Row(letter='c', freq=3)],
#          [Row(letter='d', freq=4)]]
< /code>
При преобразовании RDD1 < /code> (где каждый элемент является кортежом) в DataFrame
df
(где каждый элемент становится объектом ряд , создал ли Spark новые разделы, потому что тип данных внутри каждого раздела изменялся от кортежа на строку? Или перегородки остались точно такими же?

Подробнее здесь: https://stackoverflow.com/questions/796 ... -structure
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»