Я использую библиотеку синтаксического анализа под названием «simplehtmldom». все, что я хочу сделать, это извлечь текстовое содержимое ячеек таблицы. вот и все! это кажется таким простым... все, что я пробовал, приводит к тому, что ВСЯ СТРАНИЦА FRIGIN сбрасывается, потому что, очевидно, все примитивы пересекают дерево dom вверх, вниз и вбок. вот упрощенный пример того, что я пытаюсь сделать:
Код: Выделить всё
$saved = '';
foreach($html->find('tr') as $tr) {
foreach($tr->find('td') as $td) {
$contents = $td->plaintext;
if ($saved) {
echo "$saved : $contents
\n";
$saved = '';
}
if (strstr($contents, 'Title') || strstr($contents, 'Author')) {
$saved = $contents;
}
}
}
Я пробовал использовать «обычный текст», «внутренний текст» и «текст», но что бы я ни пытался, в конечном итоге я получаю либо бесконечную кучу дерьма, повторяемого эхом выходит, а то вообще ничего.
кто-нибудь знает, как пользоваться этим парсером? или еще мог бы предложить альтернативу тому, что я хочу сделать?
Подробнее здесь:
https://stackoverflow.com/questions/340 ... plehtmldom