Я подтвердил, что файл DOCX содержит текстовое содержимое, но когда я пытаюсь извлечь абзацы, тело.Elements
() коллекция кажется пустой, в результате чего цикл не выполняется. Однако я могу извлечь простое текстовое содержимое, вызвав body.InnerText.
Вот фрагмент моего текущего кода:
Код: Выделить всё
private string ReadDocxContentWithExactFormatting(string filePath)
{
try
{
using (WordprocessingDocument wordDocument = WordprocessingDocument.Open(filePath, false))
{
StringBuilder contentBuilder = new StringBuilder();
var body = wordDocument.MainDocumentPart.Document.Body;
// This loop is not running because
foreach (var paragraph in body.Elements
())
{
// Intended to process the paragraph text
}
return contentBuilder.ToString();
}
}
catch (Exception ex)
{
return $"Error reading file: {ex.Message}";
}
}
Как правильно извлечь абзацы с их точным форматированием?
Подробнее здесь: https://stackoverflow.com/questions/791 ... om-docx-in