Синтаксический анализ частичных фрагментов json с помощью simdjson/rapidjsonC++

Программы на C++. Форум разработчиков
Ответить Пред. темаСлед. тема
Anonymous
 Синтаксический анализ частичных фрагментов json с помощью simdjson/rapidjson

Сообщение Anonymous »

У меня есть несколько больших файлов json.gz, и я пытаюсь проанализировать эти файлы с помощью такой библиотеки, как simdjson/

Код: Выделить всё

rapidjson. Поскольку файлы в сжатом состоянии довольно большие (7 ГБ), я написал некоторый код для получения фрагментами распакованного потока строки json из файла gz.
Поскольку фрагменты json потоковые данные основаны на буфере памяти, большинство фрагментов являются недопустимыми json, а элементы могут быть закрыты только через несколько фрагментов в строке, а json глубоко вложен и сложен. Таким образом, простой анализ каждого фрагмента не работает, поскольку должен быть некоторый кеш на случай, если элементы закончатся и т. д.
Есть ли способ справиться с этим с помощью simdjson или RapidJson?
Я ни в коем случае не силен в C++, поэтому буду очень признателен за любую помощь!
Вот код:
#include 
#include 
#include 
#include 
#include "simdjson.h"

const int CHUNK_SIZE = 10240;

void decompress(const std::string &filename) {

gzFile gzFile = gzopen(filename.c_str(), "rb");

if (!gzFile) {
std::cerr 

Подробнее здесь: [url]https://stackoverflow.com/questions/79344306/parsing-partial-json-chunks-with-simdjson-rapidjson[/url]
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «C++»