Настройте Sweetviz для принудительного анализа столбца типа объекта без преобразования.Python

Программы на Python
Ответить
Anonymous
 Настройте Sweetviz для принудительного анализа столбца типа объекта без преобразования.

Сообщение Anonymous »

Рассмотрим следующий короткий пример фрейма данных:

Код: Выделить всё

df =  pd.DataFrame({'column1': [2, 4, 8, 0],
'column2': [2, 0, 0, 0],
'column3': ["test", 2, 1, 8]})
df.dtypes показывает, что типы данных столбцов:

Код: Выделить всё

column1     int64
column2     int64
column3    object
Очевидно, что столбец3 имеет тип объекта, поскольку внутри него содержатся значения смешанных типов.
Теперь я хотел бы запустить Sweetviz для этого примера набора данных. для создания отчета по столбцам и их данным:

Код: Выделить всё

import sweetviz as sv
report = sv.analyze(df)
report.show_notebook()
Проблема в том, что Sweetviz, кажется, понимает, что мой столбец3 состоит в основном из чисел, хотя он имеет тип объекта. Теперь он не генерирует отчет, а вместо этого выдает следующее предложение:

Код: Выделить всё

     Convert series [column3] to a numerical value (if makes sense):
One way to do this is:
df['column3'] = pd.to_numeric(df['column3'], errors='coerce')
К сожалению, для моего варианта использования это не вариант, поскольку я хочу, чтобы отчет также выделял неправильно используемые столбцы в моих данных, поэтому я хочу рассматривать столбец как объект, даже если это всего лишь небольшая часть значений не является числами.
Я поигрался с параметрами, которые предоставляет Sweetviz:

Код: Выделить всё

feature_config = sv.FeatureConfig(force_text=['column3'])
report = sv.analyze(df)
report.show_notebook()
Например, я ожидаю, что Sweetviz с этой конфигурацией будет обрабатывать столбец 3 как текст и игнорировать обнаружение типа, реализованное в Sweetviz.
К сожалению, я получаю то же самое предложение преобразовать столбец в числовой и преобразовать строковые значения в NaN.
Я также попробовал другие возможные параметры для пропуска столбца 3, Force_cat, Force_num.
force_cat, Force_num не Я не помогу в все приводит к одному и тому же результату.
Пропуск оставляет столбец3 в отчете, что также не является решением.
Любой способ заставить Sweetviz оставить столбец3 с объектным типом как есть есть и проанализировать его? Может ли кто-нибудь подтвердить, что это функция Sweetviz для проверки типов данных значений столбцов?

Подробнее здесь: https://stackoverflow.com/questions/783 ... conversion
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»