У меня есть приведенный ниже код
Код: Выделить всё
df1 = df.withColumn("Description", F.split(F.trim(F.regexp_replace(F.regexp_replace(F.lower(F.col("Short_Description")), \
r"[/\[/\]/\{}!-]", ' '), ' +', ' ')), ' '))\
df2 = df1.withColumn("Description", F.translate('Description', 'ãäöüẞáäčďéěíĺľňóôŕšťúůýžÄÖÜẞÁÄČĎÉĚÍĹĽŇÓÔŔŠŤÚŮÝŽ',
'aaousaacdeeillnoorstuuyzAOUSAACDEEILLNOORSTUUYZ'))
df3 = df2.withColumn('Description', F.explode(F.col('Description')))
Мне нужно обработать акцентированные буквы в столбце «Описание».
Пожалуйста, дайте мне знать, как решить эту проблему.
Подробнее здесь: https://stackoverflow.com/questions/789 ... in-pyspark