Парсинг данных с data.gov.uk/Регулярное выражение

Парсинг данных с data.gov.uk/Регулярное выражение ⇐ Php

1 сообщение • Страница 1 из 1

Anonymous

Парсинг данных с data.gov.uk/Регулярное выражение

Цитата

Сообщение Anonymous » 27 июл 2024, 13:31

Я пытаюсь понять, какое регулярное выражение мне следует использовать, чтобы получить некоторые данные с веб-сайта gov.uk.

По сути, Я использую file_get_contents по следующему URL-адресу:

https://www.compare-school- Performance.service.gov.uk/ ?keywords=[НАЗВАНИЕ ШКОЛЫ]&suggestionurn=&searchtype=search-by-name

В качестве примера — The+Castle+School в место [НАЗВАНИЕ ШКОЛЫ].

Это возвращает 4 результата. Я хочу иметь возможность фиксировать идентификатор школы, название школы и адрес школы для всех возвращаемых результатов. Может быть несколько страниц результатов, поэтому важно очистить все результаты.

Я пытался использовать для этого RegExBuddy, но не могу этого сделать. работать.

Данные, возвращаемые по каждому результату, достаточно согласованы следующим образом: -

Код: Выделить всё

 


[url=/school/110182]The Castle School[/url]



An error had occurred whilst trying to add or remove this school or college to comparison. Try again now or later.

[url=/addCompare/110182/searchResults/find-a-school-in-england?keywords=The+Castle+School&suggestionurn=&searchtype=search-by-name]Add The Castle School to comparison list[/url]





Address:
Love Lane, Newbury, RG14 2JG

Phase of education:
Primary, Secondary and 16 to 18

School type:
Special School

Ofsted rating:



1


Outstanding

(Last inspection:

08 October 2014)

Каждый результат инкапсулируется внутри

Код: Выделить всё


Подробнее здесь: [url]https://stackoverflow.com/questions/38817794/scraping-data-from-data-gov-uk-regular-expression[/url]

1722076264

Anonymous

Я пытаюсь понять, какое регулярное выражение мне следует использовать, чтобы получить некоторые данные с веб-сайта gov.uk.

По сути, Я использую file_get_contents по следующему URL-адресу:


https://www.compare-school- Performance.service.gov.uk/ ?keywords=[НАЗВАНИЕ ШКОЛЫ]&suggestionurn=&searchtype=search-by-name


В качестве примера — The+Castle+School в место [НАЗВАНИЕ ШКОЛЫ].

Это возвращает 4 результата. Я хочу иметь возможность фиксировать идентификатор школы, название школы и адрес школы для всех возвращаемых результатов. Может быть несколько страниц результатов, поэтому важно очистить все результаты.

Я пытался использовать для этого RegExBuddy, но не могу этого сделать. работать.

Данные, возвращаемые по каждому результату, достаточно согласованы следующим образом: -

[code] 


[url=/school/110182]The Castle School[/url]



An error had occurred whilst trying to add or remove this school or college to comparison. Try again now or later.

[url=/addCompare/110182/searchResults/find-a-school-in-england?keywords=The+Castle+School&suggestionurn=&searchtype=search-by-name]Add The Castle School to comparison list[/url]





Address:
Love Lane, Newbury, RG14 2JG

Phase of education:
Primary, Secondary and 16 to 18

School type:
Special School

Ofsted rating:



1


Outstanding

(Last inspection:

08 October 2014)






[/code]

Каждый результат инкапсулируется внутри 

[code]

Подробнее здесь: [url]https://stackoverflow.com/questions/38817794/scraping-data-from-data-gov-uk-regular-expression[/url]