Я использую Python 3.6.8, другие версии не используются. Мне нужно преобразовать колонку Pandas из китайского в английский, который содержит около 20% китайского текста. Из -за требований клиента я не могу использовать API или библиотеку перевода, как Google Translate; Вместо этого я должен использовать пакет pinyin .
Поэтому я написал следующий код
Код: Выделить всё
import pinyin
df['Pinyin_Text'] = df['Chinese_Text'].apply(lambda text: pinyin.get(text,format="strip", delimiter=" "))
Но я вижу, что мое поле Pinyin_Text обеспечивает фонетическую транскрипцию. Я хотел бы отформатировать поле Pinyin_Text.
Можете ли вы подсказать мне, как этого добиться?
Подробнее здесь:
https://stackoverflow.com/questions/793 ... conversion