Код: Выделить всё
COL1 COL2 COL3
a 9/8/2016 2
b 12/4/2016 23
...
n 1/1/2015 21
Когда Я использую DictVectorizer, результат будет таким:
Код: Выделить всё
{u'COL3: {0:2, 1:23 , ...,n:21}, 'COL1': {0: u'a', 1:'b', ... , n:'n'}, 'COL2': {0: u'9/8/2016' , 1: u'12/4/2016' , ... , n:u'1/1/2016'}}
Код: Выделить всё
{COL1:'a', COL2: '9/8/2016' , COL3: 2 and so on}
1-Каков наилучший способ преобразования нечисловых значений (включая дату) в числовые значения для использования в библиотеках sklearn
2- как правильно использовать DictVectorize()
Любая помощь будет оценена по достоинству.
Подробнее здесь: https://stackoverflow.com/questions/401 ... -libraries