Как вы можете заметить, прямо под ним находится метка и значение. Метка может занимать несколько строк, как и значение.
Глядя на нее, вы можете извлечь и заметить значения, определенные под ней, но попытка разделить данные по символам или выровнять их по индексу и попытаться сделать то же самое в этом случае не сработает. Значения могут быть пустыми, что обозначается пустой строкой.
В приведенной выше ситуации у меня есть 7 столбцов в первой строке, 6 во второй и 5 в третьей.
Мне нужно сгруппировать эти данные по метке, учитывая, что значение может быть нулевым (пустая строка). Как я могу добиться этого в Python и возможно ли это вообще не испортить данные?
У меня есть массив массивов, содержащих данные в следующем формате: [code]text_lines = [ ['Datum puštanja u', '', '', '', '', ' Odobreni limit u CURR', ' Tekuća klasifikacija', '', '', 'Tekuća CKKL', ' Dani', '', ' Iznos otplaćivanja u CURR', '', '', 'Naziv institucije i'] ['realizaciju', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', ' klasifikacija', ' kašnjenja', '', '', '', '', '', '', '', '', '', ' broj'] ['13.08.1999.', '', '', '', '', '', '', '', '', ' 130.000,00', 'A', '', '', '', '', '', '', ' S1', '', '', '', '', '', '', ' 100,50', '', '', '', '', '', '', ' PLACEHOLDER NAME DD'] ['Datum otplate', '', '', '', '', '', ' Neiskorišteni iznos', ' Prethodna klasifikacija', '', ' Prethodna CKKL', '', '', '', ' Žirant vraća kredit', '', '', '', ' 338-123412412-43'] ['', '', '', '', '', '', '', '', '', '', '', '', 'limita u CURR', '', '', '', '', '', '', '', '', 'klasifikacija', '', '', '', '', '', '', '', '', '', '', '', '', ' Razlog gašenja'] ['10.09.1999.', '', '', '', '', '', '', '', '', '', '', ' 0,00 B', '', '', '', '', '', '', ' S1', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', ' Completed'] ['', '', '', '', '', '', '', '', '', ' Dospjela nenaplaćena', ' Datum promjene', '', '', '', ' Datum promjene CKKL'] ['Stvarni datum zatvaranja', '', '', '', ' glavnica/kamata u', ' klasifikacije', '', '', '', ' klasifikacije', '', '', '', ' Datum i vrijeme ažuriranja'] ['', '', '', '', '', '', '', '', '', '', '', '', '', '', ' CURR'] ['07.09.1999.', '', '', '', '', '', '', '', '', '', ' 0,00/0,00 07.07.1999.', '', '', '', '', ' 07.02.1999.', '', '', '', '', ' 12.09.1999. 13:10'] ] [/code] Как вы можете заметить, прямо под ним находится метка и значение. Метка может занимать несколько строк, как и значение. Глядя на нее, вы можете извлечь и заметить значения, определенные под ней, но попытка разделить данные по символам или выровнять их по индексу и попытаться сделать то же самое в этом случае не сработает. Значения могут быть пустыми, что обозначается пустой строкой. В приведенной выше ситуации у меня есть 7 столбцов в первой строке, 6 во второй и 5 в третьей. Мне нужно сгруппировать эти данные по метке, учитывая, что значение может быть нулевым (пустая строка). Как я могу добиться этого в Python и возможно ли это вообще не испортить данные?