- Поддерживать в памяти несколько групп строк.
- Сбрасывать группу строк в файл Parquet, когда она достигает определенного порога памяти.
- Сбрасывать все оставшиеся группы строк последовательно в файл Parquet, когда файл закрыт.
С точки зрения сценария возможно ли изменить текущую библиотеку Parquet (например, parquet-rs или parquet-mr) для достижения вышеуказанного цели? Если это возможно, можете ли вы предоставить какие-либо рекомендации или примеры того, как это реализовать? Если это невозможно, существуют ли какие-либо другие рекомендуемые стратегии или обходные пути?
Спасибо за помощь!
измените текущую библиотеку Parquet
р>
Подробнее здесь: https://stackoverflow.com/questions/786 ... m-sequenti
Мобильная версия