Как транслировать большой файл на кусочке Kubernetes

Как транслировать большой файл на кусочке Kubernetes ⇐ Javascript

1 сообщение • Страница 1 из 1

Anonymous

Как транслировать большой файл на кусочке Kubernetes

Цитата

Сообщение Anonymous » 03 июн 2025, 03:35

Я хочу создать большой файл (> 200 ГБ) и сохранить его в магазине min.io. Я развертываю свои попытки в веб-приложении на капсуле Kubernetes.
Одна попытка была с модифицированным измененным потоком и библиотекой CSV-WRITER с использованием метода PutObject. Что -то нравится это: < /p>

Код: Выделить всё

const { faker } = require('@faker-js/faker');
const { createObjectCsvStringifier: createCsvStringifier } = require('csv-writer');
const Minio = require('minio');
const { Readable } = require('stream');
const minioClient = new Minio.Client({...});

const csvStringifier = createCsvStringifier({
header: [
{ id: 'userId', title: 'userId' },
{ id: 'username', title: 'username' },
.... ]});
const generateRandomRow = () => ({
userId: faker.database.mongodbObjectId(),
username: faker.person.firstName(),
...});
class csvGenerator extends Readable {
#count = 0;
#headerPushed = false;
#numRows;

constructor(numRows, options) {
super(options);
this.#numRows = numRows;
}

_read(size) {
if (!this.#headerPushed) {
this.push(csvStringifier.getHeaderString());
this.#headerPushed = true;
}

this.push(csvStringifier.stringifyRecords([generateRandomRow()]));
if (++this.#count === this.#numRows) {
this.push(null);
}
}
}
router.options('/BigFileCreation', cors());
router.post('/BigFileCreation', cors(), async (request, response) => {
const NUM_ROWS = parseInt(request.body.numberOfRows, 10);
const NAME_FILE = request.body.nameOfFile;
const BUCKET = request.body.bucket;

response.status(202).json({"Request status": "Reached"});
try {
const requestFile = await minioClient.putObject(BUCKET, NAME_FILE, new csvGenerator(NUM_ROWS, { highWaterMark: 1 }), null, metaData);
console.log(requestFile);
} catch (error) {
console.error(error);
response.status(500).json(error.toString());
}
});

< /code>
Это обрабатывает файлы менее 1 ГБ без проблем, это займет менее 5 минут.  Для создания и загрузки, но когда я прошу файл 2 ГБ или больше моего стручка, просто останавливаюсь, я думаю, я просто получаю статус Oomkilld на своем стручке, и поэтому я не получаю никаких ошибок на журналах.const csvWriter = createCsvWriter({
path: 'StellarDB.csv',
header: [
{ id: 'userId', title: 'userId' },
{ id: 'username', title: 'username' },
{ id: 'lastName', title: 'lastName' },
{ id: 'email', title: 'Email' },
{ id: 'column', title: 'column' },
{ id: 'float', title: 'float' },
{ id: 'jobArea', title: 'jobArea' },
{ id: 'jobTitle', title: 'jobTitle' },
{ id: 'phone', title: 'phone' },
{ id: 'alpha', title: 'alpha' }
]
});
const writeLargeCsvFile = async (NUM_ROWS) => {
let batchSize = 500;
let batch = [];

for (let i = 0; i < NUM_ROWS; i++) {
batch.push(generateRandomRow());

if (batch.length === batchSize || i === NUM_ROWS - 1) {
await csvWriter.writeRecords(batch);
batch = [];
}
}
};

< /code>
После дальнейших исследований я заметил, что, вероятно, проблема была в библиотеке, которую я использовал для CSV, поэтому я перешел на Fast-CSV, и моя последняя попытка была примерно так: < /p>
const { format } = require('fast-csv');
async function generateAndUploadCSV(name, NUM_ROWS, bucketName) {
const pass = new PassThrough();

const uploadPromise = minioClient.putObject(bucketName, name, pass)
.catch(err => {
console.error('Error subiendo objeto:', err);
throw err;
});

const csvStream = format({ headers: [
'userId', 'username', 'lastName', 'email', 'column', 'float', 'jobArea', 'jobTitle', 'phone', 'alpha'
]});
csvStream.pipe(pass);

let i = 0;

function write() {
let ok = true;
while (i < NUM_ROWS && ok) {
i++;
const record = {
userId: i,
username: faker.person.firstName(),
lastName: faker.person.lastName(),
email: faker.internet.email(),
column: faker.database.column(),
float: faker.number.float(3),
jobArea: faker.person.jobArea(),
jobTitle: faker.person.jobTitle(),
phone: faker.phone.imei(),
alpha: faker.string.alpha({ length: { min: 5, max: 10 } }),
};
ok = csvStream.write(record);
if (i < NUM_ROWS) {
csvStream.once('drain', () => setImmediate(write));
} else {
csvStream.end();
}
}
csvStream.on('error', err => {
pass.destroy(err);
});
write();
const objInfo = await uploadPromise;
}
< /code>
Я также назначаю больше ресурсов на моем капсуле (память 8 ГБ и 4 ядра). Но все они ведут себя одинаково, только один файл 1 ГБ и не более. Вернуться, когда я собираюсь использовать его. Это может быть полезно для файлов CSV, но что, если я захочу использовать файлы JSON. Все они работают на капсулах Kubernetes.
Просто добавляя больше информации. Мой сервисный стручок обрабатывается Knatie с файлом YML, аналогичным этим: < /p>
apiVersion: serving.knative.dev/v1
kind: Service
metadata:
name: transformTesting
spec:
template:
spec:
containers:
- image: .../...:transform-testing-SNAPSHOT
env:
- name: FORCE_NEW_REVISION
value: "true"

Желаю, чтобы кто -то мог указать мне на решение или концепцию, которую я игнорирую.

Подробнее здесь: https://stackoverflow.com/questions/796 ... rnetes-pod

1748910947

Anonymous

 Я хочу создать большой файл (> 200 ГБ) и сохранить его в магазине min.io. Я развертываю свои попытки в веб-приложении на капсуле Kubernetes.
Одна попытка была с модифицированным измененным потоком и библиотекой CSV-WRITER с использованием метода PutObject. Что -то нравится это: < /p>
[code]const { faker } = require('@faker-js/faker');
const { createObjectCsvStringifier: createCsvStringifier } = require('csv-writer');
const Minio = require('minio');
const { Readable } = require('stream');
const minioClient = new Minio.Client({...});

const csvStringifier = createCsvStringifier({
header: [
{ id: 'userId', title: 'userId' },
{ id: 'username', title: 'username' },
.... ]});
const generateRandomRow = () => ({
userId: faker.database.mongodbObjectId(),
username: faker.person.firstName(),
...});
class csvGenerator extends Readable {
#count = 0;
#headerPushed = false;
#numRows;

constructor(numRows, options) {
super(options);
this.#numRows = numRows;
}

_read(size) {
if (!this.#headerPushed) {
this.push(csvStringifier.getHeaderString());
this.#headerPushed = true;
}

this.push(csvStringifier.stringifyRecords([generateRandomRow()]));
if (++this.#count === this.#numRows) {
this.push(null);
}
}
}
router.options('/BigFileCreation', cors());
router.post('/BigFileCreation', cors(), async (request, response) => {
const NUM_ROWS = parseInt(request.body.numberOfRows, 10);
const NAME_FILE = request.body.nameOfFile;
const BUCKET = request.body.bucket;

response.status(202).json({"Request status": "Reached"});
try {
const requestFile = await minioClient.putObject(BUCKET, NAME_FILE, new csvGenerator(NUM_ROWS, { highWaterMark: 1 }), null, metaData);
console.log(requestFile);
} catch (error) {
console.error(error);
response.status(500).json(error.toString());
}
});

< /code>
Это обрабатывает файлы менее 1 ГБ без проблем, это займет менее 5 минут.  Для создания и загрузки, но когда я прошу файл 2 ГБ или больше моего стручка, просто останавливаюсь, я думаю, я просто получаю статус Oomkilld на своем стручке, и поэтому я не получаю никаких ошибок на журналах.const csvWriter = createCsvWriter({
path: 'StellarDB.csv',
header: [
{ id: 'userId', title: 'userId' },
{ id: 'username', title: 'username' },
{ id: 'lastName', title: 'lastName' },
{ id: 'email', title: 'Email' },
{ id: 'column', title: 'column' },
{ id: 'float', title: 'float' },
{ id: 'jobArea', title: 'jobArea' },
{ id: 'jobTitle', title: 'jobTitle' },
{ id: 'phone', title: 'phone' },
{ id: 'alpha', title: 'alpha' }
]
});
const writeLargeCsvFile = async (NUM_ROWS) => {
let batchSize = 500;
let batch = [];

for (let i = 0; i < NUM_ROWS; i++) {
batch.push(generateRandomRow());

if (batch.length === batchSize || i === NUM_ROWS - 1) {
await csvWriter.writeRecords(batch);
batch = [];
}
}
};

< /code>
После дальнейших исследований я заметил, что, вероятно, проблема была в библиотеке, которую я использовал для CSV, поэтому я перешел на Fast-CSV, и моя последняя попытка была примерно так: < /p>
const { format } = require('fast-csv');
async function generateAndUploadCSV(name, NUM_ROWS, bucketName) {
const pass = new PassThrough();

const uploadPromise = minioClient.putObject(bucketName, name, pass)
.catch(err => {
console.error('Error subiendo objeto:', err);
throw err;
});

const csvStream = format({ headers: [
'userId', 'username', 'lastName', 'email', 'column', 'float', 'jobArea', 'jobTitle', 'phone', 'alpha'
]});
csvStream.pipe(pass);

let i = 0;

function write() {
let ok = true;
while (i < NUM_ROWS && ok) {
i++;
const record = {
userId: i,
username: faker.person.firstName(),
lastName: faker.person.lastName(),
email: faker.internet.email(),
column: faker.database.column(),
float: faker.number.float(3),
jobArea: faker.person.jobArea(),
jobTitle: faker.person.jobTitle(),
phone: faker.phone.imei(),
alpha: faker.string.alpha({ length: { min: 5, max: 10 } }),
};
ok = csvStream.write(record);
if (i < NUM_ROWS) {
csvStream.once('drain', () => setImmediate(write));
} else {
csvStream.end();
}
}
csvStream.on('error', err => {
pass.destroy(err);
});
write();
const objInfo = await uploadPromise;
}
< /code>
Я также назначаю больше ресурсов на моем капсуле (память 8 ГБ и 4 ядра). Но все они ведут себя одинаково, только один файл 1 ГБ и не более. Вернуться, когда я собираюсь использовать его. Это может быть полезно для файлов CSV, но что, если я захочу использовать файлы JSON. Все они работают на капсулах Kubernetes.
Просто добавляя больше информации. Мой сервисный стручок обрабатывается Knatie с файлом YML, аналогичным этим: < /p>
apiVersion: serving.knative.dev/v1
kind: Service
metadata:
name: transformTesting
spec:
template:
spec:
containers:
- image: .../...:transform-testing-SNAPSHOT
env:
- name: FORCE_NEW_REVISION
value: "true"
[/code]
Желаю, чтобы кто -то мог указать мне на решение или концепцию, которую я игнорирую.  

Подробнее здесь: [url]https://stackoverflow.com/questions/79650494/how-to-stream-a-large-file-on-kubernetes-pod[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Сложность в понимании логики проблемы, основанной на кусочке вычислений

Последнее сообщение Anonymous « 12 июн 2025, 14:18
Добавлено в форуме C++

Anonymous » 12 июн 2025, 14:18 » в форуме C++

Как часть теста, я был дан, я должен кодировать приведенные ниже инструкции:

с конструкцией, что k
#include

using li = unsigned long long int;

li computeConstraint(li n, li i) {
return (n | i) - (n & i);
}

li computeFunction(li n) {
li...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
12 июн 2025, 14:18
Сложность в понимании логики проблемы, основанной на кусочке вычислений

Последнее сообщение Anonymous « 12 июн 2025, 19:50
Добавлено в форуме C++

Anonymous » 12 июн 2025, 19:50 » в форуме C++

Как часть теста, мне дали, я должен кодировать приведенные ниже инструкции:

функция f ( x ) определяется над целыми числами x > = 0 as:
f (x) = ∑ (суммирование ∑ перекрывает i),
с i удовлетворяет следующие два ограничения:
. 0
b. = x - i...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
12 июн 2025, 19:50
Сложность в понимании логики проблемы, основанной на кусочке вычислений

Последнее сообщение Anonymous « 13 июн 2025, 20:14
Добавлено в форуме C++

Anonymous » 13 июн 2025, 20:14 » в форуме C++

Как часть теста, мне дали, я должен кодировать приведенные ниже инструкции:

функция f ( x ) определяется над целыми числами x > = 0 as:
f (x) = ∑ (суммирование ∑ перекрывает i),
с i удовлетворяет следующие два ограничения:
. 0
b. = x - i...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
13 июн 2025, 20:14
Поддерживаемые версии Kubernetes для каждой версии JAR клиента Kubernetes

Последнее сообщение Anonymous « 25 июл 2024, 23:59
Добавлено в форуме JAVA

Anonymous » 25 июл 2024, 23:59 » в форуме JAVA

Один из наших искровых контейнеров использует jar под названием «kubernetes-client-4.12.0.jar». Доступен ли документ, в котором упоминается поддержка соответствующей версии Kubernetes. В настоящее время у нас есть Kubernetes версии 1.29, и нам нужно...

0 Ответы

38 Просмотры

Последнее сообщение Anonymous
25 июл 2024, 23:59
Понимание Kubernetes Watch (kubernetes-client/java api)

Последнее сообщение Anonymous « 18 окт 2024, 23:04
Добавлено в форуме JAVA

Anonymous » 18 окт 2024, 23:04 » в форуме JAVA

Я использую kubernetes-client/java API и хочу программно получить статус всех модулей во всех пространствах имен. Мой код основан на этом примере Java-библиотеки Kubernetes.

Вот фрагмент моего кода:

Watch watch = Watch.createWatch(
client,...

0 Ответы

42 Просмотры

Последнее сообщение Anonymous
18 окт 2024, 23:04

Вернуться в «Javascript»