Anonymous
Неизвестный персонаж для турецкого персонажа
Сообщение
Anonymous » 06 дек 2024, 15:36
У меня есть фрейм данных, состоящий из двух столбцов: (1) турецкие города, (2) соответствующие значения.
Код: Выделить всё
dict_ = {'City': {0: 'ADANA',
1: 'ANKARA',
2: 'ANTALYA',
3: 'AYDIN',
4: 'BALIKESİR',
5: 'BURSA',
6: 'DENİZLİ',
7: 'DÜZCE',
8: 'DİYARBAKIR',
9: 'ELAZIĞ',
10: 'GAZİANTEP',
11: 'GİRESUN',
12: 'HATAY',
13: 'KAHRAMANMARAŞ',
14: 'KARABÜK',
15: 'KARS',
16: 'KAYSERİ',
17: 'KIRIKKALE',
18: 'KIRKLARELİ',
19: 'KIRŞEHİR',
20: 'KOCAELİ',
21: 'KONYA',
22: 'KÜTAHYA',
23: 'MANİSA',
24: 'MARDİN',
25: 'MERSİN',
26: 'MUĞLA',
27: 'ORDU',
28: 'OSMANİYE',
29: 'SAKARYA',
30: 'SAMSUN',
31: 'TRABZON',
32: 'UŞAK',
33: 'YALOVA',
34: 'ZONGULDAK',
35: 'ÇORUM',
36: 'İSTANBUL',
37: 'İZMİR'},
'Value': {0: 15,
1: 25,
2: 19,
3: 2,
4: 6,
5: 5,
6: 3,
7: 1,
8: 1,
9: 1,
10: 7,
11: 2,
12: 31,
13: 5,
14: 1,
15: 1,
16: 4,
17: 5,
18: 1,
19: 1,
20: 6,
21: 4,
22: 2,
23: 1,
24: 1,
25: 5,
26: 5,
27: 4,
28: 3,
29: 2,
30: 3,
31: 2,
32: 2,
33: 1,
34: 2,
35: 2,
36: 221,
37: 6}}
data = pd.DataFrame(dict_)
Когда я пытаюсь использовать заглавную букву столбца «Город» (где первая буква — прописная, а остальные — строчные), у меня возникает странная проблема с символами.
Версия "İ" в нижнем регистре заменяется символом, когда я не могу его идентифицировать, например:
или
Код: Выделить всё
import unicodedata
unicodedata.name("i̇")
# TypeError: name() argument 1 must be a unicode character, not str
Я пробовал много решений, но безрезультатно!
Подробнее здесь:
https://stackoverflow.com/questions/774 ... -character
1733488596
Anonymous
У меня есть фрейм данных, состоящий из двух столбцов: (1) турецкие города, (2) соответствующие значения. [code]dict_ = {'City': {0: 'ADANA', 1: 'ANKARA', 2: 'ANTALYA', 3: 'AYDIN', 4: 'BALIKESİR', 5: 'BURSA', 6: 'DENİZLİ', 7: 'DÜZCE', 8: 'DİYARBAKIR', 9: 'ELAZIĞ', 10: 'GAZİANTEP', 11: 'GİRESUN', 12: 'HATAY', 13: 'KAHRAMANMARAŞ', 14: 'KARABÜK', 15: 'KARS', 16: 'KAYSERİ', 17: 'KIRIKKALE', 18: 'KIRKLARELİ', 19: 'KIRŞEHİR', 20: 'KOCAELİ', 21: 'KONYA', 22: 'KÜTAHYA', 23: 'MANİSA', 24: 'MARDİN', 25: 'MERSİN', 26: 'MUĞLA', 27: 'ORDU', 28: 'OSMANİYE', 29: 'SAKARYA', 30: 'SAMSUN', 31: 'TRABZON', 32: 'UŞAK', 33: 'YALOVA', 34: 'ZONGULDAK', 35: 'ÇORUM', 36: 'İSTANBUL', 37: 'İZMİR'}, 'Value': {0: 15, 1: 25, 2: 19, 3: 2, 4: 6, 5: 5, 6: 3, 7: 1, 8: 1, 9: 1, 10: 7, 11: 2, 12: 31, 13: 5, 14: 1, 15: 1, 16: 4, 17: 5, 18: 1, 19: 1, 20: 6, 21: 4, 22: 2, 23: 1, 24: 1, 25: 5, 26: 5, 27: 4, 28: 3, 29: 2, 30: 3, 31: 2, 32: 2, 33: 1, 34: 2, 35: 2, 36: 221, 37: 6}} data = pd.DataFrame(dict_) [/code] Когда я пытаюсь использовать заглавную букву столбца «Город» (где первая буква — прописная, а остальные — строчные), у меня возникает странная проблема с символами.[code]data['İl'].apply(str.capitalize) [/code] Версия "İ" в нижнем регистре заменяется символом, когда я не могу его идентифицировать, например: [img]https://i.sstatic.net/EPho9.png[/img] или [img]https://i.sstatic.net/nqgzF.png[/img] [code]import unicodedata unicodedata.name("i̇") # TypeError: name() argument 1 must be a unicode character, not str [/code] Я пробовал много решений, но безрезультатно! Подробнее здесь: [url]https://stackoverflow.com/questions/77409729/unknown-character-for-turkish-character[/url]