< pre class="lang-py Prettyprint-override">
Код: Выделить всё
df.withColumn(
"null1", F.col("col1").isin([None, float("nan"), 0])
).withColumn(
"null2", F.col("col2").isin([None, float("nan"), 0])
).withColumn(
"ratio",
F.when((F.col("null1") | F.col("null2")), F.lit(None))
.otherwise(F.col("col1") / F.col("col2")),
).drop("null1", "null2")
Мне интересно, есть ли какой-нибудь способ выполнить такую проверку и деление в PySpark, что значительно эффективнее эффективнее, чем то, что у меня здесь? Я попробовал функцию try_divide, но она оказалась не быстрее (и производительность была не такой).
Спасибо за любую помощь.
Подробнее здесь: https://stackoverflow.com/questions/791 ... n-in-spark
Мобильная версия