Как эффективно разделить текстовый файл с произвольным charset без повреждения кодовых точек?JAVA

Программисты JAVA общаются здесь
Ответить
Anonymous
 Как эффективно разделить текстовый файл с произвольным charset без повреждения кодовых точек?

Сообщение Anonymous »

Учитывая допустимый текстовый файл и его java.nio.charset.charset Как я могу эффективно (используя randomaccessfile.seek () или inputstream.skip () , без чтения целого файла) разделить его на два или более кусочки, в то время как не содержат частичности (это, возможно, не разделить. жестко)? Тем не менее, я не уверен, что charsetdecoder.averagebytesperchar () == charsetdecoder.maxbytesperchar () является правильным указанием кодирования фиксированной длины, поэтому было бы неплохо найти его.
Некоторые кодирующие переменную длину не являются самостоятельно-синхронизированными, как я могу найти свой характер или код в точке кода в «Постороннейке». /> Цель состоит в том, чтобы разделить файл для параллельной обработки. Классический io не загружает все ядра процессора при последовательнох чтении файла.

Подробнее здесь: https://stackoverflow.com/questions/797 ... t-damaging
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «JAVA»