Я использую openXML для преобразования HTML в XML. Затем я беру этот XML и вставляю в документ Word. Этот процесс отлично работает с текстом, простыми таблицами и т. д. Я столкнулся с тремя проблемами и хотел бы знать, может ли кто-нибудь понять их лучше, чем я. Я разместил 3 проблемы ниже. Под каждой задачей вы увидите HTML и XML, полученные в результате преобразования. Мой метод конвертации приведен ниже. См. также изображения для справки.
Проблема 2. Сложные таблицы: объединенные ячейки фактически не объединяются при преобразовании в XML.
HTML:
XML:
Проблема 3. Преобразование OrganizedList выполняется нормально. Однако в выводе XML отображается маркированный список (UnorganizedList) с пронумерованными значениями.
HTML:
Я использую openXML для преобразования HTML в XML. Затем я беру этот XML и вставляю в документ Word. Этот процесс отлично работает с текстом, простыми таблицами и т. д. Я столкнулся с тремя проблемами и хотел бы знать, может ли кто-нибудь понять их лучше, чем я. Я разместил 3 проблемы ниже. Под каждой задачей вы увидите HTML и XML, полученные в результате преобразования. Мой метод конвертации приведен ниже. См. также изображения для справки. [code]public static string htmlToOpenXml(string html) { using (MemoryStream genDoc= new MemoryStream()) { using (WordprocessingDocument package = WordprocessingDocument.Create(genDoc, WordprocessingDocumentType.Document)) { MainDocumentPart mainPart = package.MainDocumentPart; if (mainPart == null) { mainPart = package.AddMainDocumentPart(); new DocumentFormat.OpenXml.Wordprocessing.Document(new Body()).Save(mainPart); }
HtmlToOpenXml.HtmlConverter converter = new HtmlToOpenXml.HtmlConverter(mainPart); converter.ParseHtml(html); mainPart.Document.Save();
return mainPart.Document.FirstChild.OuterXml; } } } [/code] [b]Проблема 1. Простые таблицы: выравнивание ячеек не передается в выходные данные XML[/b] HTML: [code] test1
XML: [code]test1 test2test3test4 [/code] [b]Проблема 2. Сложные таблицы: объединенные ячейки фактически не объединяются при преобразовании в XML.[/b] HTML: [img]https://i.sstatic.net/lD33Fa9F.png[/img]
[b]Проблема 3. Преобразование OrganizedList выполняется нормально. Однако в выводе XML отображается маркированный список (UnorganizedList) с пронумерованными значениями.[/b] HTML: [img]https://i.sstatic.net/YFey3YWx.png[/img]