По сути, Я использую file_get_contents по следующему URL-адресу:
https://www.compare-school- Performance.service.gov.uk/ ?keywords=[НАЗВАНИЕ ШКОЛЫ]&suggestionurn=&searchtype=search-by-name
В качестве примера — The+Castle+School в место [НАЗВАНИЕ ШКОЛЫ].
Это возвращает 4 результата. Я хочу иметь возможность фиксировать идентификатор школы, название школы и адрес школы для всех возвращаемых результатов. Может быть несколько страниц результатов, поэтому важно очистить все результаты.
Я пытался использовать для этого RegExBuddy, но не могу этого сделать. работать.
Данные, возвращаемые по каждому результату, достаточно согласованы следующим образом: -
Код: Выделить всё
[url=/school/110182]The Castle School[/url]
An error had occurred whilst trying to add or remove this school or college to comparison. Try again now or later.
[url=/addCompare/110182/searchResults/find-a-school-in-england?keywords=The+Castle+School&suggestionurn=&searchtype=search-by-name]Add The Castle School to comparison list[/url]
Address:
Love Lane, Newbury, RG14 2JG
Phase of education:
Primary, Secondary and 16 to 18
School type:
Special School
Ofsted rating:
1
Outstanding
(Last inspection:
08 October 2014)
Код: Выделить всё
Подробнее здесь: [url]https://stackoverflow.com/questions/38817794/scraping-data-from-data-gov-uk-regular-expression[/url]
Мобильная версия