Собрать последовательность постраничных результатов (776 страниц) из REST API (ответ JSON) и вставить окончательный резу

Собрать последовательность постраничных результатов (776 страниц) из REST API (ответ JSON) и вставить окончательный резу ⇐ JAVA

1 сообщение • Страница 1 из 1

Anonymous

Собрать последовательность постраничных результатов (776 страниц) из REST API (ответ JSON) и вставить окончательный резу

Цитата

Сообщение Anonymous » 23 дек 2024, 22:33

Я использую Rest API, который предоставляет 6212514 строк из базы данных SQL Server. Ответом REST API является JSON, который представляет строки базы данных.
Чтобы вызвать этот API REST и получить данные дыр, я использую на каждой итерации нумерацию страниц с помощью параметров offset< /strong> и ограничение :
пример:

вызов 1 :

Код: Выделить всё

http://localhost:8080/myapi/dwcopa/getSlice?**limit**=8000&**offset**=1&buCd=XXX

вызов 2:

Код: Выделить всё

http://localhost:8080/myapi/dwcopa/getSlice?**limit**=8000&**offset**=2&buCd=XXX

.
.
.

позвоните 760 :

Код: Выделить всё

http://localhost:8080/myapi/dwcopa/getSlice?**limit**=8000&**offset**=760&buCd=XXX

limit — это количество возвращаемых объектов при каждом вызове API REST, а offset — номер страницы< /p>
Пример: предел = 8000 и смещение 1: вызов вернет первые 8000 объектов json страницы с номером 1.
Чтобы получить 6212514 строк, мне нужно сделать 776 разбивка на страницы/вызов клиентского API REST (= 6212514/8000), чтобы получить все результаты, которые мне нужно сохранить либо в таблице сервера SQL базы данных, либо создать файл csv с этими 6212514 строками.
На самом деле я использую этот код в приложении Spring Boot (версия 2.5.1) (автономный Spring Boot, а не REST API) (Java 11/Spring webflux/Webclient) ) для использования клиентского RSt API и получения всех данных путем разбиения на страницы:
В классе службы JAVA:
My Spring Webclient для использования REST API:

Код: Выделить всё

public DwCopaServiceImpl() {
this.webClient = WebClient.builder()
.codecs(codecs ->codecs.defaultCodecs().maxInMemorySize(memSize) )
.baseUrl(API_BASE_URL)
.defaultHeader(HttpHeaders.CONTENT_TYPE, API_MIME_TYPE)
.build();
}

Я использую Reactive Mono[/b], чтобы не блокировать вызов API и перебирать всю нумерацию страниц с использованием метода response.isLast(), который имеет значение false (это поле указывает, что эта страница REST API — последний)
DwCopaEntity — это объект, который представляет строку (JSON) и содержит множество строковых полей:

Код: Выделить всё

public Mono getItems() {
String url = "/dwcopa/getSlice?limit="+limit+"&offset="+offset+"&buCd="+BUCD;

return fetchItems(url).expand(response -> {
if (**response.isLast()** ) {
return Mono.empty();
}
offset += 1 ;

return fetchItems("/dwcopa/getSlice?limit="+limit+"&offset="+offset+"&buCd="+BUCD);
}).flatMap(response -> Flux.fromIterable(response.getContent())).collectList();
}

private Mono fetchItems(String url) {

System.out.println(url);
return webClient.get().uri(url).retrieve().bodyToMono(ResponseApiNeo.class);
}

После этого, чтобы получить все результаты:

Код: Выделить всё

writeStreamToFile ( myService.getItems().block().parallelStream().map(data -> data.toString()), "C:\\Users\\myfolder\\Documents\\optfile.txt") ;

Я новичок в webflux и Webclient. Этому решению требуется 25 минут для получения всех страниц REST API и создания текстового файла, который не проверяется клиентом:
Есть ли лучшее решение для многопоточности:

разбивка на страницы остатка API REST (760 страниц): (большой ответ данных: общий объем JSON 6 ГБ)
Вставка всего ответа в SQL База данных или создайте CSV файл?
Производительность имеет решающее значение (максимум 5 минут для получения всех данных).
Должен ли я исправить свой код, чтобы ускорить работу/добавить потоки?
Должен ли я исправить свой код, чтобы ускорить работу/добавить потоки?
li>

Большое спасибо за помощь.

Подробнее здесь: https://stackoverflow.com/questions/681 ... n-response

1734982437

Anonymous

Я использую Rest API, который предоставляет 6212514 строк из базы данных SQL Server. Ответом REST API является JSON, который представляет строки базы данных.
Чтобы вызвать этот API REST и получить данные дыр, я использую на каждой итерации нумерацию страниц с помощью параметров [b]offset< /strong> и ограничение[/b] :
пример:
[list]
[*]вызов 1 :

[code]http://localhost:8080/myapi/dwcopa/getSlice?**limit**=8000&**offset**=1&buCd=XXX[/code]

[*]вызов 2:
[/list]
[code]http://localhost:8080/myapi/dwcopa/getSlice?**limit**=8000&**offset**=2&buCd=XXX[/code]
.
.
.
[list]
[*]позвоните 760 :
[/list]
[code]http://localhost:8080/myapi/dwcopa/getSlice?**limit**=8000&**offset**=760&buCd=XXX[/code]
limit — это количество возвращаемых объектов при каждом вызове API REST, а offset — номер страницы< /p>
Пример: предел = 8000 и смещение 1: вызов вернет первые 8000 объектов json страницы с номером 1.
Чтобы получить 6212514 строк, мне нужно сделать 776 разбивка на страницы/вызов клиентского API REST (= 6212514/8000), чтобы получить все результаты, которые мне нужно сохранить либо в таблице сервера SQL базы данных, либо создать файл csv с этими 6212514 строками.
На самом деле я использую этот код в приложении Spring Boot (версия 2.5.1) (автономный Spring Boot, а не REST API) (Java 11/Spring webflux/Webclient) ) для использования клиентского RSt API и получения всех данных путем разбиения на страницы:
В классе службы JAVA:
My Spring [b]Webclient для использования REST API:
[code]public DwCopaServiceImpl() {
this.webClient = WebClient.builder()
.codecs(codecs ->codecs.defaultCodecs().maxInMemorySize(memSize) )
.baseUrl(API_BASE_URL)
.defaultHeader(HttpHeaders.CONTENT_TYPE, API_MIME_TYPE)
.build();
}
[/code]
Я использую Reactive Mono[/b], чтобы не блокировать вызов API и перебирать всю нумерацию страниц с использованием метода response.isLast(), который имеет значение false (это поле указывает, что эта страница REST API — последний)
[b]DwCopaEntity[/b] — это объект, который представляет строку (JSON) и содержит множество строковых полей:
[code]public Mono getItems() {
String url = "/dwcopa/getSlice?limit="+limit+"&offset="+offset+"&buCd="+BUCD;

return fetchItems(url).expand(response -> {
if (**response.isLast()** ) {
return Mono.empty();
}
offset += 1 ;

return fetchItems("/dwcopa/getSlice?limit="+limit+"&offset="+offset+"&buCd="+BUCD);
}).flatMap(response -> Flux.fromIterable(response.getContent())).collectList();
}

private Mono fetchItems(String url) {

System.out.println(url);
return webClient.get().uri(url).retrieve().bodyToMono(ResponseApiNeo.class);
}
[/code]
После этого, чтобы получить все результаты:
[code]writeStreamToFile ( myService.getItems().block().parallelStream().map(data -> data.toString()), "C:\\Users\\myfolder\\Documents\\optfile.txt") ;
[/code]
Я новичок в webflux и Webclient. Этому решению требуется 25 минут для получения всех страниц REST API и создания текстового файла, который не проверяется клиентом:
Есть ли лучшее решение для многопоточности:
[list]
разбивка на страницы остатка API REST (760 страниц): (большой ответ данных: общий объем JSON 6 ГБ)
[*]Вставка всего ответа в SQL База данных или создайте CSV файл?
[*]Производительность имеет решающее значение (максимум 5 минут для получения всех данных).
[*]Должен ли я исправить свой код, чтобы ускорить работу/добавить потоки?
[*]Должен ли я исправить свой код, чтобы ускорить работу/добавить потоки?
 li>
[/list]
Большое спасибо за помощь. 

Подробнее здесь: [url]https://stackoverflow.com/questions/68161074/collect-a-sequence-of-paged-results-776-pages-from-rest-api-json-response[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

NHibernate – Как использовать проект суммы для постраничных результатов

Последнее сообщение Anonymous « 21 сен 2024, 13:14
Добавлено в форуме C#

Anonymous » 21 сен 2024, 13:14 » в форуме C#

Я пытаюсь использовать разбиение на страницы в сочетании с проекцией суммы, чтобы получить сумму значений в столбце только для интересующей меня страницы результатов. Я использую .NET, C# и NHibernate 3.1

У меня есть ICriteria для начала, который...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
21 сен 2024, 13:14
Очистка веб-страниц Python [D:websockets.client] > GET %s HTTP/1.1 [D:websockets.client] > %s: %s не отображает все резу

Последнее сообщение Anonymous « 26 июн 2024, 19:30
Добавлено в форуме Python

Anonymous » 26 июн 2024, 19:30 » в форуме Python

Я пытаюсь выполнить парсинг веб-страниц с помощью Python 3.10 и библиотеки Requests-html 0.10.0, прилагаю код:
from requests_html import HTMLSession

url = '

s = HTMLSession()
r = s.get(url)

r.html.render(sleep=1)

products =...

0 Ответы

70 Просмотры

Последнее сообщение Anonymous
26 июн 2024, 19:30
Говорят, что на ПК с Win10 GetTickCount сбрасывается до 0 по адресу 0x9FFFFFF через 776 дней. TimeGetTime() тоже это дел

Последнее сообщение Anonymous « 15 июл 2024, 13:27
Добавлено в форуме C++

Anonymous » 15 июл 2024, 13:27 » в форуме C++

На ПК с Win10 GetTickCount сбрасывается до 0 по адресу 0x9FFFFFF через 776 дней. TimeGetTime() тоже это делает?
#include
#include
#include

int main() {
// 시작 시간 저장
DWORD startTime = GetTickCount();
DWORD startTime2 = timeGetTime();
LONGLONG...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
15 июл 2024, 13:27
Как пройти аутентификацию для FCM Rest API с помощью Google REST API в PHP REST API?

Последнее сообщение Anonymous « 22 май 2024, 23:39
Добавлено в форуме Php

Anonymous » 22 май 2024, 23:39 » в форуме Php

Мне нужно отправить уведомление с помощью FCM REST API. Однако на данный момент я не могу пройти аутентификацию с помощью ключа API. Ниже приведен API, к которому нужно обратиться.

Я получаю следующую ошибку:
{
error : {
code : 401,
message...

0 Ответы

152 Просмотры

Последнее сообщение Anonymous
22 май 2024, 23:39
Циклическое изменение зависимостей между целевыми объектами «WatchApp» и «App»; строительство может дать ненадежные резу

Последнее сообщение Anonymous « 09 ноя 2024, 22:38
Добавлено в форуме IOS

Anonymous » 09 ноя 2024, 22:38 » в форуме IOS

Я пытаюсь создать приложение для просмотра для моего текущего приложения iOS, но, хотя я не импортирую какие-либо платформы или зависимости в цель просмотра, выдает следующую ошибку:
Cycle in dependencies between targets 'Insightfull' and...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
09 ноя 2024, 22:38

Вернуться в «JAVA»