Как преобразовать документ Word в HTML с изображениямиJAVA

Программисты JAVA общаются здесь
Ответить
Anonymous
 Как преобразовать документ Word в HTML с изображениями

Сообщение Anonymous »

Существует файл документа Word (.doc), содержащий изображение. Как я могу преобразовать его в HTML с изображением?
Я попробовал использовать этот пример:
Преобразование документа Word в HTML программным способом на Java

Код: Выделить всё

public class Converter {
...

private File docFile, htmlFile;

try {
FileInputStream fos = new FileInputStream(docFile.getAbsolutePath());
HWPFDocument doc = new HWPFDocument(fos);
Document newDoc = DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument();

WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(newDoc) ;
wordToHtmlConverter.processDocument(doc);

StringWriter stringWriter = new StringWriter();

Transformer transformer = TransformerFactory.newInstance().newTransformer();
transformer.setOutputProperty(OutputKeys.INDENT, "yes");
transformer.setOutputProperty(OutputKeys.ENCODING, "utf-8");
transformer.setOutputProperty(OutputKeys.METHOD, "html");
transformer.transform(
new DOMSource(wordToHtmlConverter.getDocument()),
new StreamResult(stringWriter)
);

String html = stringWriter.toString();

try {
BufferedWriter out = new BufferedWriter(
new OutputStreamWriter(new FileOutputStream(htmlFile), "UTF-8")
);
out.write(html);
out.close();
} catch (IOException e) {
e.printStackTrace();
}

JEditorPane jEditorPane = new JEditorPane();
jEditorPane.setContentType("text/html");
jEditorPane.setEditable(false);
jEditorPane.setPage(htmlFile.toURI().toURL());

JScrollPane jScrollPane = new JScrollPane(jEditorPane);

JFrame jFrame = new JFrame("display html file");
jFrame.setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);
jFrame.getContentPane().add(jScrollPane);
jFrame.setSize(512, 342);
jFrame.setVisible(true);

} catch(Exception e) {
e.printStackTrace();
}
...
}
Но изображение потеряно.
В документации к классу WordToHtmlConverter сказано следующее:

...эта реализация не создает изображения или ссылки на них. Это
можно изменить, переопределив

Код: Выделить всё

AbstractWordConverter.processImage(Element, boolean, Picture)
метод.

Как конвертировать DOC в HTML с изображениями?

Подробнее здесь: https://stackoverflow.com/questions/138 ... ith-images
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «JAVA»