Преобразование нечислового значения в числовое с использованием библиотек PandaPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Преобразование нечислового значения в числовое с использованием библиотек Panda

Сообщение Anonymous »

Я изучаю Pandas и пришла к интересному вопросу. Итак, у меня есть такой Dataframe:

Код: Выделить всё

COL1    COL2      COL3
a     9/8/2016     2
b     12/4/2016    23
...
n     1/1/2015     21
COL1 — это строка, Col2 — это временная метка, а Col3 — число. Теперь мне нужно провести некоторый анализ этого фрейма данных, и я хочу преобразовать все нечисловые данные в числовые. Я попытался использовать DictVectorizer() для преобразования COL1 и 2 в числовые значения, но, во-первых, я не уверен, что это лучший способ сделать это, а во-вторых, я не знаю, что делать с меткой времени.
Когда Я использую DictVectorizer, результат будет таким:

Код: Выделить всё

{u'COL3: {0:2, 1:23 , ...,n:21}, 'COL1': {0: u'a', 1:'b', ... , n:'n'}, 'COL2': {0: u'9/8/2016' , 1: u'12/4/2016' , ... , n:u'1/1/2016'}}
но из того, что я узнал, должно быть так или, по крайней мере, я знаю, что мне нужно что-то вроде этого:

Код: Выделить всё

 {COL1:'a', COL2: '9/8/2016' , COL3: 2  and so on}
Итак, вопросы:
1-Каков наилучший способ преобразования нечисловых значений (включая дату) в числовые значения для использования в библиотеках sklearn
2- как правильно использовать DictVectorize()

Любая помощь будет оценена по достоинству.

Подробнее здесь: https://stackoverflow.com/questions/401 ... -libraries
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»