Удалить двойные кавычки из данных, разделенных табуляцией, в PythonPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Удалить двойные кавычки из данных, разделенных табуляцией, в Python

Сообщение Anonymous »

У меня есть данные с разделителями табуляции, хранящиеся в CSV-файле. Я пытаюсь открыть файл csv и разделить данные на разделитель '\t'. но в данных присутствуют дополнительные цитаты, по которым я не могу получить желаемый результат и сталкиваюсь с проблемами с данными. Нужна помощь.
Введите пример данных
"id name class age school doj dol status source"
"001 sandeep 10 16 dav 2012.12.12 2023.12.12 passed database"
"002 rahul 09 15 ximb 2023.11.11 ""inprogress manual"
"003 aditya 12 18 kmbb 2024.01.12 ""inprogress schoolrecord"
"004 ved ""09 15 ximb 2022.11.11 2023.12.13 passed manual"

Изображение

Код:
import pandas as pd
file='data_tab_delimited.csv'
data = pd.read_csv(file,sep="\t")
print(data)

data.to_csv('school.csv')

Полученный результат:
,id name class age school doj dol status source
0,001 sandeep 10 16 dav 2012.12.12 2023.12.12 passed database
1,"002 rahul 09 15 ximb 2023.11.11 ""inprogress manual"
2,"003 aditya 12 18 kmbb 2024.01.12 ""inprogress schoolrecord"
3,"004 ved ""09 15 ximb 2022.11.11 2023.12.13 passed manual"

Желаемый результат:
id name class age school doj dol status source
0 001 sandeep 10 16 dav 2012.12.12 2023.12.12 passed database
1 002 rahul 9 15 ximb 2023.11.11 NaN inprogress manual
2 003 aditya 12 18 kmbb 2024.01.12 NaN inprogress schoolrecord
3 004 ved NaN 15 ximb 2022.11.11 2023.12.13 passed manual

Пример исходных данных:
"Equipment Number Equipment Desc Equipment category Type of Technical Object Technical Object Desc Object number Maintenance Plan PLANT Planner Group Planner Group Desc Work Center Work Center Desc ABC indicator Maintenance plant LOCATION Location Desc Valid To Date Start-up Date Manufacturer serial number Manufacturer model number Manufacturer part number Manufacturer of asset COUNTRY Year of construction Month of construction ROOM Sort field Cost Center Catalog Profile Catalog Profile Desc Superordinate Equipment Guarantee date Warranty ends Created on FUNCTION_LOCATION STATUS SOURCE_ID"

"0000101 U02 GENANC RELAY PANEL K PWELE-OBJ ELECTRICAL OBJECTS IE0567 5010 TM2 Ture Mai-Elec EGXX1 ELECTRICAL MAINT. Unit-2(GENEANC) C 5XX SXX 9999.12.31 ""G9876.PG1/0ABC XX ABXD CO. LTD 50MAABC PWABC ELEC SYS GEN 2011.12.15 INACTIVE DUMMY"


Подробнее здесь: https://stackoverflow.com/questions/786 ... -in-python
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»