Данные должны быть такими (оба столбца находятся в строке dtype):
old_label
< th>new_label
здоровьездоровье
здоровые_советы
здоровье
омоложение
здоровье
правительство
правительство
сенат
правительство
губернатор
правительство
Поэтому я применяю эту функцию, которая проверяет каждую подстроку элемент входов:
Код: Выделить всё
def relabel(x):
for i in x:
if ("health" or "rejuvenation") in i:
return "health"
elif ("gover" or "senate") in i:
return "government"
else:
return i
Код: Выделить всё
data['new_label'] = data['old_label'].apply(relabel)
Как это сделать исправить это?
Подробнее здесь: https://stackoverflow.com/questions/785 ... data-frame