Код: Выделить всё
Pros and Cons of a Website
(this is a sample of what it uses as line breaks. Take note of the tag).
A SAMPLE TEXT
...same pattern in div 1
...same...
Код: Выделить всё
...A SAMPLE TEXT
...same pattern in div 1
...same...
Код: Выделить всё
$dom = new DOMDocument;
$dom->loadHTML($filecontent, LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD);
$xpath = new DOMXPath($dom);
$body = $xpath->query('//html/body');
$nodes = $body->item(0)->getElementsByTagName('*');
foreach ($nodes as $node) {
if($node->tagName=='script') $node->parentNode->removeChild($node);
if($node->tagName=='a') continue;
$attrs = $xpath->query('@*', $node);
foreach($attrs as $attr) {
$attr->parentNode->removeAttribute($attr->nodeName);
}
}
echo str_ireplace(['', ''], '', $dom->saveHTML($body->item(0)));
Код: Выделить всё
Pros and Cons of a Website
A SAMPLE TEXT
...same pattern in div 1
...same...
Код: Выделить всё
if($node->tagName=='script' || $node->tagName=='h1') $node->parentNode->removeChild($node);
Код: Выделить всё
becomes
- Как получить внутренний HTML-код DOMNode? (Ответ Хаима Эвги, я не знаю, как его правильно реализовать, ответ Keyacom тоже), Ответ Марко Марсалы - самый близкий, который я получил, но все элементы div сохранили свои классы.
Подробнее здесь: https://stackoverflow.com/questions/793 ... omdocument