Как обрабатывать букву с акцентом в Pyspark

Как обрабатывать букву с акцентом в Pyspark ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как обрабатывать букву с акцентом в Pyspark

Цитата

Сообщение Anonymous » 19 сен 2024, 21:13

У меня есть фрейм данных pyspark, в который мне нужно добавить «перевод» для столбца.
У меня есть приведенный ниже код

Код: Выделить всё

df1 = df.withColumn("Description", F.split(F.trim(F.regexp_replace(F.regexp_replace(F.lower(F.col("Short_Description")), \
r"[/\[/\]/\{}!-]", ' '), ' +', ' ')), ' '))\

df2 = df1.withColumn("Description", F.translate('Description', 'ãäöüẞáäčďéěíĺľňóôŕšťúůýžÄÖÜẞÁÄČĎÉĚÍĹĽŇÓÔŔŠŤÚŮÝŽ',
'aaousaacdeeillnoorstuuyzAOUSAACDEEILLNOORSTUUYZ'))

df3 = df2.withColumn('Description', F.explode(F.col('Description')))

Я получаю сообщение об ошибке несоответствия типов данных: аргумент 1 требует строкового типа, «Описание» имеет тип массива
Мне нужно обработать акцентированные буквы в столбце «Описание».
Пожалуйста, дайте мне знать, как решить эту проблему.

Подробнее здесь: https://stackoverflow.com/questions/789 ... in-pyspark

1726769616

Anonymous

У меня есть фрейм данных pyspark, в который мне нужно добавить «перевод» для столбца.
У меня есть приведенный ниже код
[code]df1 = df.withColumn("Description", F.split(F.trim(F.regexp_replace(F.regexp_replace(F.lower(F.col("Short_Description")), \
r"[/\[/\]/\{}!-]", ' '), ' +', ' ')), ' '))\

df2 = df1.withColumn("Description", F.translate('Description', 'ãäöüẞáäčďéěíĺľňóôŕšťúůýžÄÖÜẞÁÄČĎÉĚÍĹĽŇÓÔŔŠŤÚŮÝŽ',
'aaousaacdeeillnoorstuuyzAOUSAACDEEILLNOORSTUUYZ'))

df3 = df2.withColumn('Description', F.explode(F.col('Description')))
[/code]
Я получаю сообщение об ошибке несоответствия типов данных: аргумент 1 требует строкового типа, «Описание» имеет тип массива
Мне нужно обработать акцентированные буквы в столбце «Описание».
Пожалуйста, дайте мне знать, как решить эту проблему. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78998782/how-to-handle-accented-letter-in-pyspark[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Измените заглавную букву B в изображении svg, но сохраните букву B как букву для Google.

Последнее сообщение Anonymous « 03 окт 2023, 11:33
Добавлено в форуме Jquery

Anonymous » 03 окт 2023, 11:33 » в форуме Jquery

Возможно, у меня сложный и запутанный вопрос. Недавно для нас был разработан логотип и буква «Б» — это уникальная буква Б. Эта буква Б имеет свой уникальный вид, но мы бы хотели использовать ее для заголовков H1 на разных страницах. Причина, по...

0 Ответы

54 Просмотры

Последнее сообщение Anonymous
03 окт 2023, 11:33
Писать первую букву сложных имен с акцентом [дубликат]

Последнее сообщение Anonymous « 15 окт 2024, 18:42
Добавлено в форуме Php

Anonymous » 15 окт 2024, 18:42 » в форуме Php

Я хотел бы использовать заглавную первую букву имени и фамилии, особенно составные имена, такие как, например, «Жан-Люк». У меня есть код, который работает правильно.
Например, «жан-Люк» становится «Жан-Люк», а «жан д'Аван» становится «Жан д'Аван»....

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
15 окт 2024, 18:42
Polars – заменить букву в строке на прописную букву.

Последнее сообщение Anonymous « 15 янв 2025, 18:42
Добавлено в форуме Python

Anonymous » 15 янв 2025, 18:42 » в форуме Python

Есть ли какой-нибудь способ в полярах заменить символ сразу после _ на верхний регистр, используя замену регулярного выражения? До сих пор я достиг этого с помощью Polars.Expr.map_elements.
Есть ли альтернатива использованию собственного API...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
15 янв 2025, 18:42
Polars – заменить букву в строке на прописную букву.

Последнее сообщение Anonymous « 15 янв 2025, 19:19
Добавлено в форуме Python

Anonymous » 15 янв 2025, 19:19 » в форуме Python

Есть ли какой-нибудь способ в полярах заменить символ сразу после _ на верхний регистр, используя замену регулярного выражения? До сих пор я достиг этого с помощью Polars.Expr.map_elements.
Есть ли альтернатива использованию собственного API...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
15 янв 2025, 19:19
IText 8.0.5 управляет французским акцентом в Java

Последнее сообщение Anonymous « 09 окт 2024, 14:45
Добавлено в форуме JAVA

Anonymous » 09 окт 2024, 14:45 » в форуме JAVA

Я использую iTextPdf 8.0.5 для создания PDF-файла.
У меня проблема с французскими символами, такими как é, à, â, ç.
Например, со словом «défunt».
/>Я получаю либо «dfunt», либо «d©funt», либо «défunt»
Я пробовал использовать стандартный шрифт,...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
09 окт 2024, 14:45

Вернуться в «Python»