Pyspark: Как заменить совпавшую строку значением из словаря, используя regexp_replace? ⇐ Python
-
Гость
Pyspark: Как заменить совпавшую строку значением из словаря, используя regexp_replace?
из pyspark.sql импортировать SparkSession из функций импорта pyspark.sql как F импортировать повторно spark = SparkSession.builder.appName("SubstituicaoDicionario").getOrCreate() словарь = { "word1": "замена 1", "word2": "замена 2", } data = \[("Это пример со словом1 и словом2.",)\] df = spark.createDataFrame(data, \["Текст"\]) Regular_expression = "|".join(r"\\b" + re.escape(word) + r"\\b" для слова в словаре.keys()) df = df.withColumn("Replaced_Text", F.regexp_replace("Text", fr"{regular_expression}", словарь\[f"{$0}"\])) df.show(усечение=False) Синтаксическая ошибка: неверный синтаксис Файл "\", строка 1 ($0) ^ SyntaxError: неверный синтаксис +--------------------------+------ ----------------------------------------------------------------+ |Текст |Замененный_текст | +--------------------------+------ ----------------------------------------------------------------+ |Это пример со словом1 и словом2.|Это пример с заменой 1 и заменой 2.| +--------------------------+------ ----------------------------------------------------------------+
Мобильная версия