Моя цель состоит в том, чтобы анализировать большие файлы CSV с помощью C ++ в проекте QT в среде OSX.
(когда я говорю CSV, я имею в виду TSV и другие варианты 1 ГБ ~ 5 ГБ). < /p>
< P> кажется простой задачей, но все становится сложным, когда размеры файлов становятся больше. Я не хочу писать свой собственный анализатор из -за множества случаев, связанных с файлами CSV, а также Около 90 ~ 120 секунд на моей машине, что неприемлемо. Я сейчас ничего не делаю с данными, я просто обрабатываю и отбрасываю данные для целей тестирования. Но единственной достаточно быстрой библиотекой была Fast-CPP-CSV-Parser, которая дает приемлемые результаты: 15 секунд на моей машине, но она работает только тогда, когда структура файла известна. < /P>
Пример с использованием : fast-cpp-csv-parser < /p>
#include "csv.h"
int main(){
io::CSVReader in("ram.csv");
in.read_header(io::ignore_extra_column, "vendor", "size", "speed");
std::string vendor; int size; double speed;
while(in.read_row(vendor, size, speed)){
// do stuff with the data
}
}
< /code>
Как видите, я не могу загрузить произвольные файлы, и я должен специфически определить переменные в соответствии с моей структурой файла. Я не знаю ни о каком методе, который позволяет мне динамически создавать эти переменные во время выполнения. -Пырсер класс Linereader, который действительно быстрый (около 7 секунд для чтения всего файла), а затем анализируйте каждую строку с помощью CCCSVParser Lib, который может обрабатывать строки, но это займет около 40 секунд, пока не сделано, это улучшение по сравнению с первыми попытками, но но это все еще неприемлем. Потратил много времени на поиск, чтобы найти решение этой проблемы, и я действительно скучаю по свободе, которую менеджеры пакетов, такие как npm или pip , предлагают при поиске вне решений коробки .
Я буду признателен за любое предложение о том, как решить эту проблему. /> При использовании подхода @fbucek время обработки сокращено до 25 секунд, что является большим улучшением.
Можем ли мы оптимизировать это еще больше? < /п>
Подробнее здесь: https://stackoverflow.com/questions/274 ... les-with-c
Анализировать очень большие файлы CSV с C ++ ⇐ C++
Программы на C++. Форум разработчиков
-
Anonymous
1738273081
Anonymous
Моя цель состоит в том, чтобы анализировать большие файлы CSV с помощью C ++ в проекте QT в среде OSX.
(когда я говорю CSV, я имею в виду TSV и другие варианты 1 ГБ ~ 5 ГБ). < /p>
< P> кажется простой задачей, но все становится сложным, когда размеры файлов становятся больше. Я не хочу писать свой собственный анализатор из -за множества случаев, связанных с файлами CSV, а также Около 90 ~ 120 секунд на моей машине, что неприемлемо. Я сейчас ничего не делаю с данными, я просто обрабатываю и отбрасываю данные для целей тестирования. Но единственной достаточно быстрой библиотекой была Fast-CPP-CSV-Parser, которая дает приемлемые результаты: 15 секунд на моей машине, но она работает только тогда, когда структура файла известна. < /P>
Пример с использованием : fast-cpp-csv-parser < /p>
#include "csv.h"
int main(){
io::CSVReader in("ram.csv");
in.read_header(io::ignore_extra_column, "vendor", "size", "speed");
std::string vendor; int size; double speed;
while(in.read_row(vendor, size, speed)){
// do stuff with the data
}
}
< /code>
Как видите, я не могу загрузить произвольные файлы, и я должен специфически определить переменные в соответствии с моей структурой файла. Я не знаю ни о каком методе, который позволяет мне динамически создавать эти переменные во время выполнения. -Пырсер класс Linereader, который действительно быстрый (около 7 секунд для чтения всего файла), а затем анализируйте каждую строку с помощью CCCSVParser Lib, который может обрабатывать строки, но это займет около 40 секунд, пока не сделано, это улучшение по сравнению с первыми попытками, но но это все еще неприемлем. Потратил много времени на поиск, чтобы найти решение этой проблемы, и я действительно скучаю по свободе, которую менеджеры пакетов, такие как [b] npm [/b] или [b] pip [/b], предлагают при поиске вне решений коробки .
Я буду признателен за любое предложение о том, как решить эту проблему. /> При использовании подхода @fbucek время обработки сокращено до 25 секунд, что является большим улучшением.
[b] Можем ли мы оптимизировать это еще больше? [/b] < /п>
Подробнее здесь: [url]https://stackoverflow.com/questions/27401401/parse-very-large-csv-files-with-c[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия