Чтение файла фиксированной длины пакетноPython

Программы на Python
Anonymous
 Чтение файла фиксированной длины пакетно

Сообщение Anonymous »

У меня есть текстовый файл в формате фиксированной длины, как ниже -< /p>

Код: Выделить всё

K57 details 1234
K58 abcdefghijklmnopqrstuvwxyz  0123456789
K58 abcdefghijklmnopqrstuvwxyz  0123456789
K58 abcdefghijklmnopqrstuvwxyz  0123456789
K57 details 5678
K58 abcdefghijklmnopqrstuvwxyz  9876543210
K58 abcdefghijklmnopqrstuvwxyz  9876543210
K58 abcdefghijklmnopqrstuvwxyz  9876543210
.....
.....
Здесь K57 — это запись заголовка каждой партии, а записи K58 — это подробные записи партии.
Может быть несколько партий, каждая из которых имеет запись заголовка (K57), за которой следует несколько подробных сведений. (K58).
Мне нужно извлечь значения из каждой записи K58 вместе с подробностями записи заголовка в следующем формате -

Код: Выделить всё

+----------+------------+------------+
|K57_detail|K58_detail_1|K58_detail_2|
+----------+------------+------------+
|1234      |abcdef      |01234       |
|1234      |abcdef      |01234       |
|1234      |abcdef      |01234       |
|5678      |abcdef      |98765       |
|5678      |abcdef      |98765       |
|5678      |abcdef      |98765       |
+----------+------------+------------+
Я знаю функцию Pyspark substring(), которая может помочь извлечь необходимое значение из каждой строки.
Но моя реальная задача — донести информацию о записи заголовка K57 до каждой ее детали. записей.
Любая помощь в достижении вышеуказанного результата будет оценена по достоинству.
Заранее спасибо.

Подробнее здесь: https://stackoverflow.com/questions/793 ... th-batches

Вернуться в «Python»