TypeError: кодеры требуют, чтобы их вход был равномерно строк или числа. Получил ['int', 'str']

TypeError: кодеры требуют, чтобы их вход был равномерно строк или числа. Получил ['int', 'str'] ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

TypeError: кодеры требуют, чтобы их вход был равномерно строк или числа. Получил ['int', 'str']

Цитата

Сообщение Anonymous » 12 фев 2025, 05:13

Я уже направил посты здесь, здесь и здесь. Не отмечайте его как дубликат. < /P>
Я работаю над проблемой бинарной классификации, где мой набор данных имеет категориальные и численные столбцы. < /P>
Тем не менее, некоторые категориальных столбцов имеет сочетание числовых и строковых значений. Тем не менее, они указывают только имя категории. и т. д.
Я думаю, что приведенная ниже ошибка добавлена из -за таких значений, как 4 и 5 .
Поэтому я попробовал ниже. Конвертировать их в категорию dataType. (но все же это не работает) < /p>

Код: Выделить всё

cols=X_train.select_dtypes(exclude='int').columns.to_list()
X_train[cols]=X_train[cols].astype('category')
< /code>
И моя информация о данных выглядит ниже < /p>

Int64Index: 683 entries, 21 to 965
Data columns (total 9 columns):
#   Column                                           Non-Null Count  Dtype
---  ------                                           --------------  -----
0   Feature_A                                        683 non-null    category
1   Product Classification                           683 non-null    category
2   Industry                                         683 non-null    category
3   DIVISION                                         683 non-null    category
4   biz_category                                     683 non-null    category
5   Country                                          683 non-null    category
6   Product segment                                  683 non-null    category
7   SUBREGION                                        683 non-null    category
8   Quantity 1st year                                683 non-null    int64
dtypes: category(8), int64(1)
< /code>
Итак, после преобразования dtype, когда я пробую приведенную смесь, я получаю ошибку < /p>
print("Before OverSampling, counts of label '1': {}".format(sum(y_train == 1)))
print("Before OverSampling, counts of label '0': {} \n".format(sum(y_train == 0)))
cat_index = [0,1,2,3,4,5,6,7]
# import SMOTE module from imblearn library
# pip install imblearn (if you don't have imblearn in your system)
from imblearn.over_sampling import SMOTE, SMOTENC
sm = SMOTENC(categorical_features=cat_index,random_state = 2,sampling_strategy = 'minority')
X_train_res, y_train_res = sm.fit_resample(X_train, y_train)
< /code>
Это приводит к ошибке, как показано ниже < /p>

----------------- ------------------------------------------------------ ------------ TypeError Traceback (самый последний звонок
last)
~ ~ appdata\raming\python\python39\site-packages \sklearn\tils_encode.py
в _unique_python (values, return_inverse)
134
-> 135 Uniques = sorted (Uniques_set)
136 Uniques.extend (missing_values.to_list ()) < /p>
typeerror: '
Во время обработки вышеуказанного исключения произошло другое исключение: < /p>
typeError traceback (самый последний звонок
last)
c:lasers \Sathap~1\ imblearn.over_sampling importmote, Smotenc
7 sm = smotenc (categorical_features = cat_index, random_state = 2, sampling_strategy = 'minority')
----> 8 x_train_res, y_train_res = sm.fit_resample (x_train y_train)
9
10 print ('после перевозки, форма train_x: {}'. Format (x_train_res.shape)) < /p>
~ \ appdata \ roaming \ Python \ python39 \ site-packages \ imblearn \ base.py в
fit_resample (self, x, y)
81)
82
---> 83 output = self . Пакеты \ imblearn \ over_sampling_smote \ base.py
in  fit_resample (self, x, y)
511
512 # Ввод Onehotencoder должен быть плотным
-- -> 513 x_ohe = self.ohe < /em> .fit_transform (
514 x_categorical.toarray () if sparse.issparse (x_categorical) else x_categorical
515) < /p>
 ~ \ Appdata \ roaming \ python \ python39 \ site-packages \ sklearn \ preprocessing_encoders.py
in fit_transform (self, x, y)
486 ""
487 self._validate_keywords (br /> 486 ""
487 )
-> 488 return super (). fit_transform (x, y)
489
490 def transform (self, x): < /p>
~ \ Appdata \ roaming \ python \ python39 \ site-packages \ sklearn \ base.py в
fit_transform (self, x, y, ** fit_params)
850, если y не:
851 # Способный метод Arity 1 (неконтролируемое преобразование)
-> 852 return self.fit (x, ** fit_params) .transform (x)
853 else:
854 # Метод подключения Arity 2 (контролируемое преобразование) br /> 459 "" "
460 self._validate_keywords ()
-> 461 self.   fit (x, harder_unknown = self.handle_unknow /> 462 self.drop_idx < /em> = self._compute_drop_idx ()
463 return self < /p>
~ \ appdata \ roaming \ python \ python39 \ site-packages \ sklearn \ preprocessing_encoders.py
in _fit (self, x, harder_unknown, force_all_finite)
92 xi = x_list [i]
93 if self.categories == "Auto":
- -> 94 Cats = _unique (xi)
95 els > ~ \ Appdata \ roaming \ python \ python39 \ site-packages \ sklearn \ utils_encode.py
in _unique (values, return_inverse)
29 "" "
30 if values.dtype == Объект:
---> 31 return _unique_python (values, return_inverse = return_inverse)
32 # numerical
33 out = np.unique (значения, return_inverse = return_inverse) < /p>
~ aappdata\raaming\python\python39\site-packages \Sklearn\tils_encode.py
in _unique_python (values, return_inverse)
138, кроме типа:
139 типы = отсортирован (t.  QualName < /strong> для t в set (type (v) для v в значениях))
-> 140 reage typeError (
141 "Энкодеры требуют, чтобы их ввод был равномерно "
142 f" или струны или числа. Получил {types} "< /p>
typeerror: кодеры требуют, чтобы их ввод был равномерно строк или
. > 
Должен ли я преобразовать y_train

в категорию? п>

Подробнее здесь: https://stackoverflow.com/questions/711 ... umbers-got

1739326381

Anonymous

 Я уже направил посты здесь, здесь и здесь. Не отмечайте его как дубликат. < /P>
Я работаю над проблемой бинарной классификации, где мой набор данных имеет категориальные и численные столбцы. < /P>
Тем не менее, некоторые категориальных столбцов имеет сочетание числовых и строковых значений. Тем не менее, они указывают только имя категории. и т. д. 
Я думаю, что приведенная ниже ошибка добавлена из -за таких значений, как 4 и 5 . 
Поэтому я попробовал ниже. Конвертировать их в категорию  dataType. (но все же это не работает) < /p>
[code]cols=X_train.select_dtypes(exclude='int').columns.to_list()
X_train[cols]=X_train[cols].astype('category')
< /code>
И моя информация о данных выглядит ниже < /p>

Int64Index: 683 entries, 21 to 965
Data columns (total 9 columns):
#   Column                                           Non-Null Count  Dtype
---  ------                                           --------------  -----
0   Feature_A                                        683 non-null    category
1   Product Classification                           683 non-null    category
2   Industry                                         683 non-null    category
3   DIVISION                                         683 non-null    category
4   biz_category                                     683 non-null    category
5   Country                                          683 non-null    category
6   Product segment                                  683 non-null    category
7   SUBREGION                                        683 non-null    category
8   Quantity 1st year                                683 non-null    int64
dtypes: category(8), int64(1)
< /code>
Итак, после преобразования dtype, когда я пробую приведенную смесь, я получаю ошибку < /p>
print("Before OverSampling, counts of label '1': {}".format(sum(y_train == 1)))
print("Before OverSampling, counts of label '0': {} \n".format(sum(y_train == 0)))
cat_index = [0,1,2,3,4,5,6,7]
# import SMOTE module from imblearn library
# pip install imblearn (if you don't have imblearn in your system)
from imblearn.over_sampling import SMOTE, SMOTENC
sm = SMOTENC(categorical_features=cat_index,random_state = 2,sampling_strategy = 'minority')
X_train_res, y_train_res = sm.fit_resample(X_train, y_train)
< /code>
Это приводит к ошибке, как показано ниже < /p>

----------------- ------------------------------------------------------ ------------ TypeError Traceback (самый последний звонок
last)
~ ~ appdata\raming\python\python39\site-packages \sklearn\tils_encode.py
в _unique_python (values, return_inverse)
134
-> 135 Uniques = sorted (Uniques_set)
136 Uniques.extend (missing_values.to_list ()) < /p>
typeerror: '
Во время обработки вышеуказанного исключения произошло другое исключение: < /p>
typeError traceback (самый последний звонок
last)
c:lasers \Sathap~1\ imblearn.over_sampling importmote, Smotenc
7 sm = smotenc (categorical_features = cat_index, random_state = 2, sampling_strategy = 'minority')
----> 8 x_train_res, y_train_res = sm.fit_resample (x_train y_train)
9
10 print ('после перевозки, форма train_x: {}'. Format (x_train_res.shape)) < /p>
~ \ appdata \ roaming \ Python \ python39 \ site-packages \ imblearn \ base.py в
fit_resample (self, x, y)
81)
82
---> 83 output = self . Пакеты \ imblearn \ over_sampling_smote \ base.py
in  fit_resample (self, x, y)
511
512 # Ввод Onehotencoder должен быть плотным
-- -> 513 x_ohe = self.ohe < /em> .fit_transform (
514 x_categorical.toarray () if sparse.issparse (x_categorical) else x_categorical
515) < /p>
 ~ \ Appdata \ roaming \ python \ python39 \ site-packages \ sklearn \ preprocessing_encoders.py
in fit_transform (self, x, y)
486 ""
487 self._validate_keywords (br /> 486 ""
487 )
-> 488 return super (). fit_transform (x, y)
489
490 def transform (self, x): < /p>
~ \ Appdata \ roaming \ python \ python39 \ site-packages \ sklearn \ base.py в
fit_transform (self, x, y, ** fit_params)
850, если y не:
851 # Способный метод Arity 1 (неконтролируемое преобразование)
-> 852 return self.fit (x, ** fit_params) .transform (x)
853 else:
854 # Метод подключения Arity 2 (контролируемое преобразование) br /> 459 "" "
460 self._validate_keywords ()
-> 461 self.   fit (x, harder_unknown = self.handle_unknow /> 462 self.drop_idx < /em> = self._compute_drop_idx ()
463 return self < /p>
~ \ appdata \ roaming \ python \ python39 \ site-packages \ sklearn \ preprocessing_encoders.py
in _fit (self, x, harder_unknown, force_all_finite)
92 xi = x_list [i]
93 if self.categories == "Auto":
- -> 94 Cats = _unique (xi)
95 els > ~ \ Appdata \ roaming \ python \ python39 \ site-packages \ sklearn \ utils_encode.py
in _unique (values, return_inverse)
29 "" "
30 if values.dtype == Объект:
---> 31 return _unique_python (values, return_inverse = return_inverse)
32 # numerical
33 out = np.unique (значения, return_inverse = return_inverse) < /p>
~ aappdata\raaming\python\python39\site-packages \Sklearn\tils_encode.py
in _unique_python (values, return_inverse)
138, кроме типа:
139 типы = отсортирован (t.  QualName < /strong> для t в set (type (v) для v в значениях))
-> 140 reage typeError (
141 "Энкодеры требуют, чтобы их ввод был равномерно "
142 f" или струны или числа. Получил {types} "< /p>
typeerror: кодеры требуют, чтобы их ввод был равномерно строк или
. > 
Должен ли я преобразовать y_train [/code] в категорию? п> 

Подробнее здесь: [url]https://stackoverflow.com/questions/71193740/typeerror-encoders-require-their-input-to-be-uniformly-strings-or-numbers-got[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

TypeError: кодеры требуют, чтобы их вход был равномерно строк или числа. Получил ['int', 'str']

Последнее сообщение Anonymous « 11 фев 2025, 16:20
Добавлено в форуме Python

Anonymous » 11 фев 2025, 16:20 » в форуме Python

Я уже направил посты здесь, здесь и здесь. Не отмечайте его как дубликат.
Я работаю над проблемой бинарной классификации, где мой набор данных имеет категориальные и численные столбцы.
Тем не менее, некоторые категориальных столбцов имеет...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
11 фев 2025, 16:20
Как преобразовать список[int, int, int] в кортеж[int, int, int], а не в кортеж[int, ...]

Последнее сообщение Anonymous « 27 апр 2024, 23:47
Добавлено в форуме Python

Anonymous » 27 апр 2024, 23:47 » в форуме Python

Предположим, у меня есть две функции: func1 и func2. func1 возвращает список из 3 целых чисел, а func2 принимает кортеж из 3 целых чисел. Как мне преобразовать список в кортеж таким образом, чтобы можно было предотвратить ошибки с помощью средств...

0 Ответы

292 Просмотры

Последнее сообщение Anonymous
27 апр 2024, 23:47
Почему DICT [STR, STR] назначается для картирования [STR | int, str]?

Последнее сообщение Anonymous « 14 авг 2025, 19:04
Добавлено в форуме Python

Anonymous » 14 авг 2025, 19:04 » в форуме Python

Учитывая этот код:
from collections.abc import Mapping

def my_fn(m: Mapping ):
print(m)

d = { a : b }
my_fn(d)

Mypy 1.16.0 и Pyright 1.1.400 Отчет о том, что неверно назначить d аргументу m . Например, выходы Pyright :
error: Argument of type...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
14 авг 2025, 19:04
Почему DICT [STR, STR] назначается для картирования [STR | int, str] (тип ключа отображения не коварит)?

Последнее сообщение Anonymous « 14 авг 2025, 20:23
Добавлено в форуме Python

Anonymous » 14 авг 2025, 20:23 » в форуме Python

Учитывая этот код:
from collections.abc import Mapping

def my_fn(m: Mapping ):
print(m)

d = { a : b }
my_fn(d)

Mypy 1.16.0 и Pyright 1.1.400 Отчет о том, что неверно назначить d аргументу m . Например, выходы Pyright :
error: Argument of type...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
14 авг 2025, 20:23
Почему DICT [STR, STR] назначается для картирования [STR | int, str] (тип ключа отображения не коварит)?

Последнее сообщение Anonymous « 20 авг 2025, 05:00
Добавлено в форуме Python

Anonymous » 20 авг 2025, 05:00 » в форуме Python

Учитывая этот код:
from collections.abc import Mapping

def my_fn(m: Mapping ):
print(m)

d = { a : b }
my_fn(d)

Mypy 1.16.0 и Pyright 1.1.400 Отчет о том, что неверно назначить d аргументу m . Например, выходы Pyright :
error: Argument of type...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
20 авг 2025, 05:00

Вернуться в «Python»