Удалить двойные кавычки из данных, разделенных табуляцией, в PythonPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Удалить двойные кавычки из данных, разделенных табуляцией, в Python

Сообщение Anonymous »

У меня есть данные, разделенные мазком, хранящиеся в CSV-файле, я пытаюсь открыть CSV-файл и разделить данные разделителем «\t». но в данных присутствуют дополнительные кавычки, по которым я не могу получить желаемый результат и сталкиваюсь с проблемами с данными. нужна срочная помощь.
введите пример данных

Код: Выделить всё

"id name    class   age school  doj dol status  source"
"001    sandeep 10  16  dav 2012.12.12  2023.12.12  passed  database"
"002    rahul   09  15  ximb    2023.11.11  ""inprogress    manual"
"003    aditya  12  18  kmbb    2024.01.12  ""inprogress    schoolrecord"
"004    ved ""09    15  ximb    2022.11.11  2023.12.13  passed  manual"

Изображение

код:

Код: Выделить всё

import pandas as pd
file='data_tab_delimited.csv'
data = pd.read_csv(file,sep="\t")
print(data)

data.to_csv('school.csv')
вывод будет:

Код: Выделить всё

,id name    class   age school  doj dol status  source
0,001   sandeep 10  16  dav 2012.12.12  2023.12.12  passed  database
1,"002  rahul   09  15  ximb    2023.11.11  ""inprogress    manual"
2,"003  aditya  12  18  kmbb    2024.01.12  ""inprogress    schoolrecord"
3,"004  ved ""09    15  ximb    2022.11.11  2023.12.13  passed  manual"
желаемый результат:

Код: Выделить всё

id     name  class  age school         doj         dol    status        source
0  001  sandeep     10   16    dav  2012.12.12  2023.12.12    passed     database
1  002    rahul      9   15   ximb  2023.11.11         NaN  inprogress      manual
2  003   aditya     12   18   kmbb  2024.01.12         NaN  inprogress  schoolrecord
3  004      ved    NaN   15   ximb  2022.11.11  2023.12.13    passed       manual
введите исходные данные:

Код: Выделить всё

"Equipment Number   Equipment Desc  Equipment category  Type of Technical Object    Technical Object Desc   Object number   Maintenance Plan    PLANT   Planner Group   Planner Group Desc  Work Center Work Center Desc    ABC indicator   Maintenance plant   LOCATION    Location Desc   Valid To Date   Start-up Date   Manufacturer serial number  Manufacturer model number   Manufacturer part number    Manufacturer of asset   COUNTRY Year of construction    Month of construction   ROOM    Sort field  Cost Center Catalog Profile Catalog Profile Desc    Superordinate Equipment Guarantee date  Warranty ends   Created on  FUNCTION_LOCATION   STATUS  SOURCE_ID"

"0000101    U02 GENANC RELAY PANEL  K   PWELE-OBJ   ELECTRICAL OBJECTS  IE0567      5010    TM2 Ture Mai-Elec   EGXX1   ELECTRICAL MAINT. Unit-2(GENEANC)   C   5XX SXX     9999.12.31      ""G9876.PG1/0ABC            XX ABXD CO. LTD                     50MAABC PWABC   ELEC SYS GEN                2011.12.15      INACTIVE    DUMMY"
пожалуйста, помогите в этом вопросе.

Подробнее здесь: https://stackoverflow.com/questions/786 ... -in-python
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»