Кадр данных Pyspark не возвращает строки, имеющие значение более 8 цифрPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Кадр данных Pyspark не возвращает строки, имеющие значение более 8 цифр

Сообщение Anonymous »

Я создал образец фрейма данных в Pyspark, и столбец идентификатора содержит несколько значений, содержащих более 8 цифр. Но он возвращает только те строки, имеющие менее 8 цифр в поле идентификатора. Может ли кто-нибудь подсказать, как написать правильный код, который будет возвращать все значения, если условие соответствует.

data = [["2116722", "sravan", "company 1"],
["2716722", "ojaswi", "company 2"],
["2119722", "bobby", "company 3"],
["21156311722", "sravan", "company 1"],
["21422", "ojaswi", None],
["2216722", "rohith", "company 2"],
["3116722672", "gnanesh", "company 1"],
["2156722", None, "company 2"],
["4115666122", "bobby", "company 3"],
["21190745", "rohith", "company 2"]]

# specify column names
columns = ['ID', 'Employee NAME', 'Company Name']

# creating a dataframe from the lists of data
dataframe = spark.createDataFrame(data, columns)
dataframe.where(dataframe["ID"] > 100000).show()


Выход:
+--------+-------------+------------+
| ID|Employee NAME|Company Name|
+--------+-------------+------------+
| 2116722| sravan| company 1|
| 2716722| ojaswi| company 2|
| 2119722| bobby| company 3|
| 2216722| rohith| company 2|
| 2156722| NULL| company 2|
|21190745| rohith| company 2|
+--------+-------------+------------+

Ожидаемый результат
+--------+-------------+------------+
| ID|Employee NAME|Company Name|
+--------+-------------+------------+
| 2116722| sravan| company 1|
| 2716722| ojaswi| company 2|
| 2119722| bobby| company 3|
| 2216722| rohith| company 2|
| 2156722| NULL| company 2|
|21190745| rohith| company 2|
|21156311722| sravan| company 1|
|4115666122| bobby| company 3|
|3116722672| gnanesh| company 1|
+--------+-------------+------------+



Подробнее здесь: https://stackoverflow.com/questions/787 ... n-8-digits
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Кадр данных Pyspark не возвращает строки, имеющие значение более 8 цифр
    Anonymous » » в форуме Python
    0 Ответы
    16 Просмотры
    Последнее сообщение Anonymous
  • Pandas: как преобразовать кадр данных M*N в кадр данных (M*N)*1
    Anonymous » » в форуме Python
    0 Ответы
    88 Просмотры
    Последнее сообщение Anonymous
  • Удалить строки, имеющие определенное значение, из DataGridView C#.
    Anonymous » » в форуме C#
    0 Ответы
    19 Просмотры
    Последнее сообщение Anonymous
  • Ошибка NonExistentTimeError при преобразовании кадра данных pandas в кадр данных pyspark
    Anonymous » » в форуме Python
    0 Ответы
    16 Просмотры
    Последнее сообщение Anonymous
  • Ошибка NonExistentTimeError при преобразовании кадра данных pandas в кадр данных pyspark
    Anonymous » » в форуме Python
    0 Ответы
    23 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»