Разбор PDF-таблиц в CSV с помощью phpPhp

Кемеровские программисты php общаются здесь
Ответить
Anonymous
 Разбор PDF-таблиц в CSV с помощью php

Сообщение Anonymous »

Мне нужно преобразовать PDF-файл с таблицами в CSV, поэтому я использовал «PDFPARSER», чтобы проанализировать весь текст, а затем с помощью pregmatch_all выполнить поиск по шаблонам каждой таблицы, чтобы я мог создать массив из каждой таблицы PDF-файла. .

Следующий PDF-файл имеет следующую структуру:

Изображение


При анализе я получаю это

ECO-698 Кондиционер Frio-Calor ECO-CHI-522 Chimenea eléctrica con patas

Я понял, как предварительно сопоставить_все ECO-XXXXX, но я не знаю, как предварительно сопоставить все описания

Это то, что работает для ECO-XXXXXX

$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('publication.pdf');

$text = $pdf->getText();
echo $text;

$pattern = '/ECO-[.-^*-]{3,}| ECO-[.-^*-]{4,}\s\b[NMB]\b|ECO-[.-^*-]{4,}\sUP| ECO-[.-^*-]{3,}\sUP\s[B-N-M]{1}| ECO-[.-^*-]{3,}\sRX/' ;
preg_match_all($pattern, $text, $array);

echo "";
print_r($array);


Я понимаю

Array ( [0] => Array ( [0] => ECO-698 [1] => ECO-CHI-522 [2]


Подробнее здесь: https://stackoverflow.com/questions/564 ... v-with-php
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Php»