Pyspark заменяет строки в столбце кадра данных Spark ⇐ Python
-
Anonymous
Pyspark заменяет строки в столбце кадра данных Spark
Я хотел бы выполнить базовую обработку столбца Spark Dataframe, заменив подстроки. Какой самый быстрый способ сделать это?
В моем текущем варианте использования у меня есть список адресов, которые я хочу нормализовать. Например, этот фрейм данных:
идентификатор адреса 1 2 фут-лейн 2 переулок 10 бар 3 24 штаны в пер. Станет
идентификатор адреса 1 2 фута 2 10 бар, дюйм 3 24 штаны в пер.
Я хотел бы выполнить базовую обработку столбца Spark Dataframe, заменив подстроки. Какой самый быстрый способ сделать это?
В моем текущем варианте использования у меня есть список адресов, которые я хочу нормализовать. Например, этот фрейм данных:
идентификатор адреса 1 2 фут-лейн 2 переулок 10 бар 3 24 штаны в пер. Станет
идентификатор адреса 1 2 фута 2 10 бар, дюйм 3 24 штаны в пер.
Мобильная версия