Как я могу читать разреженную матрицу, сохраненную в файле CSV? (Питон 3.6.4)Python

Программы на Python
Ответить
Anonymous
 Как я могу читать разреженную матрицу, сохраненную в файле CSV? (Питон 3.6.4)

Сообщение Anonymous »

С помощью countvectorizer я извлек векторы признаков из тысяч электронных писем и сохранил их в файл CSV

Код: Выделить всё

dictionary = open (r'''C:\Users\User\Desktop\csmp3\stemmedDictionary.txt''',"r")
dic = list(set(dictionary.read().splitlines()))
cv = CountVectorizer(vocabulary = dic, binary = True)
#~PRESENCE FEATURE VECTOR~#
#TRAIN
pdt = open (r'''C:\Users\User\Desktop\csmp3\presence-dataset-training-stemmed.csv''',"w")
matWriter = csv.writer(pdt,delimiter = ',')

for i in range (1,2): #45252
processed_email = open(r'''C:\Users\User\Desktop\csmp3\processed\processed'''+str(i)+'''.txt''',"r")
presence_array = cv.transform(processed_email)

matWriter.writerow(presence_array)
processed_email.close()
pdt.close()
Это часть проекта фильтрации спама с использованием Наивного Байеса, и наш набор данных довольно велик. Я надеюсь использовать эту разреженную матрицу для метода частичной подгонки Бернулли Наивного Байеса. Я просто не могу понять, как загрузить разреженную матрицу из файла. Я уже пробовал numpy.loadtxt, но он выдает:

ValueError: не удалось преобразовать строку в число с плавающей запятой


Подробнее здесь: https://stackoverflow.com/questions/497 ... thon-3-6-4
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»