Как прочитать пустую строку, а также нулевые значения из файла CSV в Pyspark? - Цифровое Кемерово

Как прочитать пустую строку, а также нулевые значения из файла CSV в Pyspark? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как прочитать пустую строку, а также нулевые значения из файла CSV в Pyspark?

Цитата

Сообщение Anonymous » 31 июл 2025, 22:10

tl; dr; - Как использовать "" в качестве пустого значения и ничего, как null в файле CSV? Я пытаюсь использовать "" в качестве пустого значения и ничего, как null , мое ожидание было то, что nullvalue = none и emptyvalue = "" должен делать то, что я хочу, но оба интерпретируются как null .
Я пробовал все комбинации nullvalue и yetpal -wylobe

Код: Выделить всё

with open("/dbfs/tmp/c.csv", "w") as f:
f.write('''id,val
1,
2,""
3,str1
''')

for e, n in [('', None), ('', ''), (None, None), (None, '')]:
print(f'e: "{e}", n: "{n}"')
df = spark.read.csv('dbfs:/tmp/c.csv', header=True, emptyValue=e, nullValue=n).show()
< /code>
prints: < /p>
e: "", n: "None"
+---+-----+
| id|  val|
+---+-----+
|  1| NULL|
|  2| NULL|
|  3| str1|
+---+-----+

e: "", n: ""
+---+-----+
| id|  val|
+---+-----+
|  1| NULL|
|  2| NULL|
|  3| str1|
+---+-----+

e: "None", n: "None"
+---+-----+
| id|  val|
+---+-----+
|  1| NULL|
|  2| NULL|
|  3| str1|
+---+-----+

e: "None", n: ""
+---+-----+
| id|  val|
+---+-----+
|  1| NULL|
|  2| NULL|
|  3| str1|
+---+-----+
< /code>

ps: он работает в Scala, просто не в Python. Итак, я предполагаю, что это может иметь какое-то отношение к тому факту, что Print («true», если »« else »false,)

печатает« false » в python.

prints: < /p>
+---+-----+
| id| val|
+---+-----+
| 1| NULL|
| 2| |
| 3| str1|
+---+-----+
< /code>

Я прочитал: < /p>

[*] spark.read. Чтение пустой строки как нулевая, когда данные считываются из файла части
[*] Прочтите Spark CSV с пустыми значениями без преобразования в null
Опция чтения файла CSV Spark CSV для чтения пустого/пустого значения только в виде пустого значения.>

Подробнее здесь: https://stackoverflow.com/questions/797 ... in-pyspark

Реклама

1753989035

Anonymous

 tl; dr; - Как использовать ""  в качестве пустого значения и ничего, как null  в файле CSV? Я пытаюсь использовать ""  в качестве пустого значения и ничего, как null , мое ожидание было то, что nullvalue = none  и emptyvalue = ""  должен делать то, что я хочу, но оба интерпретируются как null . 
Я пробовал все комбинации nullvalue  и yetpal -wylobe [code]with open("/dbfs/tmp/c.csv", "w") as f:
f.write('''id,val
1,
2,""
3,str1
''')

for e, n in [('', None), ('', ''), (None, None), (None, '')]:
print(f'e: "{e}", n: "{n}"')
df = spark.read.csv('dbfs:/tmp/c.csv', header=True, emptyValue=e, nullValue=n).show()
< /code>
prints: < /p>
e: "", n: "None"
+---+-----+
| id|  val|
+---+-----+
|  1| NULL|
|  2| NULL|
|  3| str1|
+---+-----+

e: "", n: ""
+---+-----+
| id|  val|
+---+-----+
|  1| NULL|
|  2| NULL|
|  3| str1|
+---+-----+

e: "None", n: "None"
+---+-----+
| id|  val|
+---+-----+
|  1| NULL|
|  2| NULL|
|  3| str1|
+---+-----+

e: "None", n: ""
+---+-----+
| id|  val|
+---+-----+
|  1| NULL|
|  2| NULL|
|  3| str1|
+---+-----+
< /code>

ps: он работает в Scala, просто не в Python. Итак, я предполагаю, что это может иметь какое-то отношение к тому факту, что Print («true», если »« else »false,) [/code] печатает« false » в python. 

prints: < /p>
+---+-----+
| id|  val|
+---+-----+
|  1| NULL|
|  2|     |
|  3| str1|
+---+-----+
< /code>

Я прочитал: < /p>

[*] spark.read. Чтение пустой строки как нулевая, когда данные считываются из файла части
[*] Прочтите Spark CSV с пустыми значениями без преобразования в null
 Опция чтения файла CSV Spark CSV для чтения пустого/пустого значения только в виде пустого значения.> 

Подробнее здесь: [url]https://stackoverflow.com/questions/79721713/how-to-read-empty-string-as-well-as-null-values-from-a-csv-file-in-pyspark[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как прочитать пустую строку, а также нулевые значения из файла CSV в Pyspark?

Последнее сообщение Anonymous « 01 авг 2025, 21:03
Добавлено в форуме Python

Anonymous » 01 авг 2025, 21:03 » в форуме Python

tl; dr; -- How to use as empty value and nothing as NULL in a csv file?
I have a need where I need to specify an empty string in a csv file, which also has some NULL values. Я пытаюсь использовать в качестве пустого значения и ничего, как null , мое...

0 Ответы

1 Просмотры

Последнее сообщение Anonymous
01 авг 2025, 21:03
Как прочитать пустую строку, а также нулевые значения из файла CSV в Pyspark?

Последнее сообщение Anonymous « 02 авг 2025, 00:41
Добавлено в форуме Python

Anonymous » 02 авг 2025, 00:41 » в форуме Python

Читать Spark CSV с пустыми значениями без преобразования в NULL не отвечает на это, потому что:

Это Scala, и это pyspark.
Scala Solution. nullvalue от pyspark = none , который дает неправильный результат, как указано ниже. - Как использовать...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
02 авг 2025, 00:41
Почему короткие нулевые значения преобразуются в нулевые значения int для сравнения с нулевым?

Последнее сообщение Anonymous « 15 дек 2024, 16:15
Добавлено в форуме C#

Anonymous » 15 дек 2024, 16:15 » в форуме C#

Когда я сравниваю короткие значения, допускающие значение NULL, компилятор сначала преобразует их в целые числа, чтобы выполнить сравнение с NULL. Например, рассмотрим этот простой код:

short? cTestA;
if (cTestA == null) { ... }

Компилятор...

0 Ответы

36 Просмотры

Последнее сообщение Anonymous
15 дек 2024, 16:15
Анализ CSV возвращает нулевые значения для всех полей при анализе данных CSV.

Последнее сообщение Anonymous « 25 дек 2024, 18:23
Добавлено в форуме JAVA

Anonymous » 25 дек 2024, 18:23 » в форуме JAVA

Я пытаюсь преобразовать данные CSV в объект Java с помощью CsvMapper. Вот схема CSV и формат данных во время отладки:
Метод анализа:
private List parseData(String csvData, Class modelClass) {
try {
CsvMapper csvMapper = CsvMapper.builder()...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
25 дек 2024, 18:23
Анализ CSV возвращает нулевые значения для всех полей при анализе данных CSV.

Последнее сообщение Anonymous « 25 дек 2024, 19:23
Добавлено в форуме JAVA

Anonymous » 25 дек 2024, 19:23 » в форуме JAVA

Я пытаюсь преобразовать данные CSV в объект Java с помощью CsvMapper. Вот схема CSV и формат данных во время отладки:
Метод анализа:
private List parseData(String csvData, Class modelClass) {
try {
CsvMapper csvMapper = CsvMapper.builder()...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
25 дек 2024, 19:23

Вернуться в «Python»

Programmiererforum