Настройка Pycaret для одного горячего кодирования

Настройка Pycaret для одного горячего кодирования ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Настройка Pycaret для одного горячего кодирования

Цитата

Сообщение Anonymous » 02 июл 2024, 05:10

У меня возникла проблема с одной горячей кодировкой категориальных переменных в Pycaret. Проблема в том, что даже при установке моих категориальных переменных конвейер применяет нормализацию к категориальным переменным, и я понятия не имею, что я делаю неправильно.
Поначалу, используя приведенный ниже код, все работает. нормально:

Код: Выделить всё

from pycaret.classification import *
from pycaret.datasets import get_data
import pandas as pd
import numpy as np
import seaborn as sns
dataset = get_data('income')
dataset.dtypes

Пока я не начну установку и

Код: Выделить всё

exp_clf01 = setup(  data = dataset
, target = 'income >50K'
, session_id = 123
, numeric_features = ['age','education-num','capital-gain','capital-loss','hours-per-week']
, categorical_features = ['workclass','education','marital-status','occupation','relationship','race','sex','native-country']
)
df_transformed = get_config("X_train")
df_transformed.head()

После попытки просмотра заголовка фрейма данных он применяет только одно горячее кодирование к гонке столбцов и нормализует остальные категориальные входные данные, и я не могу понять, почему.< /p>

возраст
рабочий класс
образование
номер образования
семейное положение
род занятий
другие столбцы

46.0
0.303273
0.271186
11,0
0,101942
0,484643
...

27,0
0,218620
0,412939< /td>
13,0
0,044165
0,484643
...< /td>

33,0
0,218557
0,568315
14,0
0,448894
0,455449
...

60,0
0,218557
0.412673
13.0
0.448894
0.484286
.. .

25,0
0,218620
0,063798
6,0
0,044165
0,229692
. ..

Как я могу это предотвратить поведение?

Подробнее здесь: https://stackoverflow.com/questions/740 ... t-encoding

1719886208

Anonymous

У меня возникла проблема с одной горячей кодировкой категориальных переменных в Pycaret. Проблема в том, что даже при установке моих категориальных переменных конвейер применяет нормализацию к категориальным переменным, и я понятия не имею, что я делаю неправильно.
Поначалу, используя приведенный ниже код, все работает. нормально:
[code]from pycaret.classification import *
from pycaret.datasets import get_data
import pandas as pd
import numpy as np
import seaborn as sns
dataset = get_data('income')
dataset.dtypes
[/code]
Пока я не начну установку и
[code]exp_clf01 = setup(  data = dataset
, target = 'income >50K'
, session_id = 123
, numeric_features = ['age','education-num','capital-gain','capital-loss','hours-per-week']
, categorical_features = ['workclass','education','marital-status','occupation','relationship','race','sex','native-country']
)
df_transformed = get_config("X_train")
df_transformed.head()
[/code]
После попытки просмотра заголовка фрейма данных он применяет только одно горячее кодирование к гонке столбцов и нормализует остальные категориальные входные данные, и я не могу понять, почему.< /p>




возраст
рабочий класс
образование
номер образования
семейное положение
род занятий
другие столбцы




46.0
0.303273
0.271186
11,0
0,101942
0,484643
...


27,0
0,218620
0,412939< /td>
13,0
0,044165
0,484643
...< /td>


33,0
0,218557
0,568315 
14,0
0,448894
0,455449
... 


60,0
0,218557
 0.412673
13.0
0.448894
0.484286
.. .


25,0
0,218620
0,063798
6,0
0,044165
0,229692
. ..




Как я могу это предотвратить поведение? 

Подробнее здесь: [url]https://stackoverflow.com/questions/74001472/pycaret-setup-for-one-hot-encoding[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Могу ли я добавить многоуровневое индексирование для функций горячего кодирования?

Последнее сообщение Anonymous « 24 мар 2024, 04:56
Добавлено в форуме Python

Anonymous » 24 мар 2024, 04:56 » в форуме Python

Я работаю над набором данных грибовидных функций, почти все из которых я закодировал с помощью pandas в двоичный формат, но некоторые закодированы номинально. Мне интересно, могу ли я использовать исходные столбцы в качестве второго индекса, чтобы...

0 Ответы

66 Просмотры

Последнее сообщение Anonymous
24 мар 2024, 04:56
Панда: попытка горячего кодирования ИЗ нескольких столбцов

Последнее сообщение Anonymous « 02 ноя 2024, 12:51
Добавлено в форуме Python

Anonymous » 02 ноя 2024, 12:51 » в форуме Python

Когда я ищу эту тему, я получаю ответы, которые не соответствуют тому, что я хочу сделать. Допустим, у меня есть такая таблица:

Элемент
N1
N2
N3
N4

Элемент1
1
2
4
8

Item2
2
3
6
7

Item3
4
5
7
9

Item4
1
5
6
7

Item5
3
4
7
8

Я хотел...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
02 ноя 2024, 12:51
Одна проблема с несоответствием функций горячего кодирования

Последнее сообщение Anonymous « 20 ноя 2024, 02:58
Добавлено в форуме Python

Anonymous » 20 ноя 2024, 02:58 » в форуме Python

Я провожу Kaggle Challenge, который требует от нас предсказать 12 идентификаторов продуктов, которые клиенты с наибольшей вероятностью купят, исходя из их прошлой истории. Просмотр всех деталей кода занял бы слишком много времени. Я столкнулся со...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
20 ноя 2024, 02:58
Одна проблема с несоответствием функций горячего кодирования

Последнее сообщение Anonymous « 20 ноя 2024, 04:01
Добавлено в форуме Python

Anonymous » 20 ноя 2024, 04:01 » в форуме Python

Я провожу Kaggle Challenge, который требует от нас предсказать 12 идентификаторов продуктов, которые клиенты с наибольшей вероятностью купят, исходя из их прошлой истории. Просмотр всех деталей кода занял бы слишком много времени. Я столкнулся со...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
20 ноя 2024, 04:01
Где я могу найти информацию о механизме кодирования кодирования REX2 REX2

Последнее сообщение Anonymous « 11 мар 2025, 13:07
Добавлено в форуме Linux

Anonymous » 11 мар 2025, 13:07 » в форуме Linux

Я хочу найти механизм кодирования префикса rex2. Я говорю о архитектуре X64. Кстати, REX2, включающий себя R16-R31 Регистры. mov %r29, %r31

Есть ли регистры R0-R7?
(rax - r0)... (rdi - r7), r8, ...

rex2 - r16-31
egpr - rex2.
egpr - расширяет...

0 Ответы

46 Просмотры

Последнее сообщение Anonymous
11 мар 2025, 13:07

Вернуться в «Python»