Как я могу оптимизировать свой цикл «Foreach» для более эффективного чтения и обработки каждой строки текстового файла в

Как я могу оптимизировать свой цикл «Foreach» для более эффективного чтения и обработки каждой строки текстового файла в ⇐ C#

1 сообщение • Страница 1 из 1

Anonymous

Как я могу оптимизировать свой цикл «Foreach» для более эффективного чтения и обработки каждой строки текстового файла в

Цитата

Сообщение Anonymous » 28 апр 2025, 20:57

У меня есть код C#, который считывает файл TXT, обрабатывает каждую строку и впоследствии вставляет документы в базу данных MongoDB. Поскольку файл содержит много строк (приблизительно 70 тысяч), как чтение всех строк, так и вставка все в базу данных занимает слишком много времени. To try to optimize this process, I attempted:

Using bulkWrite to speed up the database I/O operations;
Transforming the bulkWrite into an async task, so that the next batch can be populated while the previous one is still being inserted;

After these changes, Ядро моего кода настроена аналогично: < /p>

Код: Выделить всё

foreach (string row in File.ReadLines(newFilePath))
{
var contents = row.Split('|');
switch (contents[0])
{
case "02":
{
// Line processing for variable population
var bob = new BsonDocument{//some bson fields}
insertProceeds.Add(new InsertOneModel(bob));
}
break;
case "03":
{
// Line processing for variable population
var bob = new BsonDocument{//some bson fields}
insertProceeds.Add(new InsertOneModel(bob));
}
break;
}
if (insertProceeds.Count >= 500 )
{
if (bulkInsert != null)
bulkInsert.Wait();
bulkInsert = _variables.context_.BulkWriteInsertEQProceeds(insertProceeds);
insertProceeds = new List();
}
};
if (insertProceeds.Count > 0 || deleteProceeds.Count > 0)
{
_variables.context_.BulkWriteInsertEQProceeds(insertProceeds);
}

Я прочитал некоторую информацию о реализации параллелизма в циклах, но я не совсем понял, в каких случаях я должен создать одновременную сумку вместо списка (независимо от того, должен ли я преобразовать все списки - как для чтения, так и для редактирования - в одновременную сумку или только списки, которые редактируются во время манипулирования линейными), и если существуют другие параметры, которые должны быть уравновешены для оптимизации, чтобы оптимизировать эффективность. /> Помимо проблемы параллелизма, есть ли что -нибудь еще, что можно сделать, чтобы сделать это быстрее? Запустив код в режиме отладки, я заметил несоответствие за время, необходимое для заполнения списка, используемого в объеме, который иногда происходит через 625 мс, а в других случаях занимает более 10000 мс. Есть ли способ уменьшить эти колебания?

Подробнее здесь: https://stackoverflow.com/questions/795 ... a-text-fil

1745863073

Anonymous

 У меня есть код C#, который считывает файл TXT, обрабатывает каждую строку и впоследствии вставляет документы в базу данных MongoDB. Поскольку файл содержит много строк (приблизительно 70 тысяч), как чтение всех строк, так и вставка все в базу данных занимает слишком много времени. To try to optimize this process, I attempted:
[list]
[*]Using bulkWrite to speed up the database I/O operations;
[*]Transforming the bulkWrite into an async task, so that the next batch can be populated while the previous one is still being inserted;
[/list]
After these changes, Ядро моего кода настроена аналогично: < /p>
[code]
foreach (string row in File.ReadLines(newFilePath))
{
var contents = row.Split('|');
switch (contents[0])
{
case "02":
{
// Line processing for variable population
var bob = new BsonDocument{//some bson fields}
insertProceeds.Add(new InsertOneModel(bob));
}
break;
case "03":
{
// Line processing for variable population
var bob = new BsonDocument{//some bson fields}
insertProceeds.Add(new InsertOneModel(bob));
}
break;
}
if (insertProceeds.Count >= 500 )
{
if (bulkInsert != null)
bulkInsert.Wait();
bulkInsert = _variables.context_.BulkWriteInsertEQProceeds(insertProceeds);
insertProceeds = new List();
}
};
if (insertProceeds.Count > 0 || deleteProceeds.Count > 0)
{
_variables.context_.BulkWriteInsertEQProceeds(insertProceeds);
}
[/code]
Я прочитал некоторую информацию о реализации параллелизма в циклах, но я не совсем понял, в каких случаях я должен создать одновременную сумку вместо списка (независимо от того, должен ли я преобразовать все списки - как для чтения, так и для редактирования - в одновременную сумку или только списки, которые редактируются во время манипулирования линейными), и если существуют другие параметры, которые должны быть уравновешены для оптимизации, чтобы оптимизировать эффективность. />  Помимо проблемы параллелизма, есть ли что -нибудь еще, что можно сделать, чтобы сделать это быстрее? Запустив код в режиме отладки, я заметил несоответствие за время, необходимое для заполнения списка, используемого в объеме, который иногда происходит через 625 мс, а в других случаях занимает более 10000 мс. Есть ли способ уменьшить эти колебания?  

Подробнее здесь: [url]https://stackoverflow.com/questions/79597052/how-can-i-optimize-my-foreach-loop-to-read-and-process-each-line-of-a-text-fil[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как оптимизировать потоковую передачу Spark Structured с помощью Delta Table для эффективного сбора данных?

Последнее сообщение Anonymous « 10 мар 2025, 19:27
Добавлено в форуме Python

Anonymous » 10 мар 2025, 19:27 » в форуме Python

Я использую потоковую потоковую передачу Apache Spark для обработки входящих данных о событиях Debezium в партиях каждые 1 час (время расписания). Текущая реализация работает, но она кажется медленной и не удобной для производительности.
def...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
10 мар 2025, 19:27
Оптимизировать цикл foreach в laravel

Последнее сообщение Anonymous « 12 ноя 2024, 03:10
Добавлено в форуме Php

Anonymous » 12 ноя 2024, 03:10 » в форуме Php

Мне нужна массовая вставка в таблицу подписчиков и таблицу полей подписчиков, в которой данные поступают из файла CSV.

Таблице подписчиков нужен только адрес электронной почты, а таблице полей подписчиков нужен идентификатор подписчика из таблицы...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
12 ноя 2024, 03:10
Как узнать количество вкладок в начале каждой строки текстового файла?

Последнее сообщение Anonymous « 03 ноя 2024, 00:54
Добавлено в форуме Python

Anonymous » 03 ноя 2024, 00:54 » в форуме Python

У меня есть текстовый файл, в котором каждая строка может начинаться с нескольких табов, включая отсутствие табов. Например, первая строка начинается без табуляции, вторая строка — с одной вкладкой, а третья — с двумя вкладками:
Chapter 1
1
1.1...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
03 ноя 2024, 00:54
Цикл foreach добавляет повторяющиеся строки в таблицу? [закрыто]

Последнее сообщение Anonymous « 12 апр 2024, 08:13
Добавлено в форуме C#

Anonymous » 12 апр 2024, 08:13 » в форуме C#

Я работаю над логикой, которая выполняет два отдельных действия. Первое действие просто обновит существующие строки в таблице, а второе действие создаст новую запись в другой таблице. Действие обновления работает нормально, но действие добавления...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
12 апр 2024, 08:13
Как преобразовать этот код foreach в Parallel.ForEach?

Последнее сообщение Anonymous « 08 май 2024, 20:08
Добавлено в форуме C#

Anonymous » 08 май 2024, 20:08 » в форуме C#

Меня немного смущает Parallel.ForEach.

Что такое Parallel.ForEach и что именно он делает?

Пожалуйста, не ссылайтесь на ссылки MSDN.

Вот простой пример:

string[] lines = File.ReadAllLines(txtProxyListPath.Text);
List list_lines = new...

0 Ответы

143 Просмотры

Последнее сообщение Anonymous
08 май 2024, 20:08

Вернуться в «C#»