Функция Python для добавления двоичных столбцов в df ⇐ Python
-
Гость
Функция Python для добавления двоичных столбцов в df
У меня есть фрейм данных productusage, например:
| функцияSk| Номер человека | | -------- | -------- | | А | 1001 | | Б | 1001 | | С | 1003 | | С | 1004 | | А | 1002 | | Б | 1005 | Мне нужно создать функцию Python, которая имеет список номеров людей в качестве входных данных и выводит кадр даты, который содержит значения столбца featureSk из productusage в качестве столбцов. По сути, должен быть столбец для каждого значения featureSk и 0 в строке, если PersonNumber не существует в productusage, и 1, если он существует. существуют в productusage
вывод должен быть кадром данных pandas, например:
| Номер человека | А | Б | С | | -------- | -------- | -------- | -------- | | 1001 | 1 | 1 | 0 | | 1002 | 0 | 0 | 0 | | 1003 | 0 | 0 | 1 | Это то, что я пробовал
def add_featureSk_to_dataframe(Person_list): Person_list = pd.DataFrame(Person_list) df = использование продукта unique_values = df[featureSk].unique() для значения в unique_vaues: для человека в Persons_list: df = df.withColumn(значение, лямбда person: 1, если person в Persons_list, иначе 0) возврат DF person_test = [1001,1002,1003] add_featureSk_to_dataframe (person_test) Получается сообщение об ошибке, что FeatureSk не определен, хотя productusage определен
У меня есть фрейм данных productusage, например:
| функцияSk| Номер человека | | -------- | -------- | | А | 1001 | | Б | 1001 | | С | 1003 | | С | 1004 | | А | 1002 | | Б | 1005 | Мне нужно создать функцию Python, которая имеет список номеров людей в качестве входных данных и выводит кадр даты, который содержит значения столбца featureSk из productusage в качестве столбцов. По сути, должен быть столбец для каждого значения featureSk и 0 в строке, если PersonNumber не существует в productusage, и 1, если он существует. существуют в productusage
вывод должен быть кадром данных pandas, например:
| Номер человека | А | Б | С | | -------- | -------- | -------- | -------- | | 1001 | 1 | 1 | 0 | | 1002 | 0 | 0 | 0 | | 1003 | 0 | 0 | 1 | Это то, что я пробовал
def add_featureSk_to_dataframe(Person_list): Person_list = pd.DataFrame(Person_list) df = использование продукта unique_values = df[featureSk].unique() для значения в unique_vaues: для человека в Persons_list: df = df.withColumn(значение, лямбда person: 1, если person в Persons_list, иначе 0) возврат DF person_test = [1001,1002,1003] add_featureSk_to_dataframe (person_test) Получается сообщение об ошибке, что FeatureSk не определен, хотя productusage определен
Мобильная версия