Невозможно извлечь текст из конкретного шаблона электронной почты в Gmail (Spring Boot & Imap)JAVA

Программисты JAVA общаются здесь
Anonymous
Невозможно извлечь текст из конкретного шаблона электронной почты в Gmail (Spring Boot & Imap)

Сообщение Anonymous »

Я работаю над процессом извлечения электронной почты, используя Java, Spring Boot и IMAP для чтения электронных писем от Gmail. Процесс отлично работает для большинства электронных писем, извлекая только текстовый контент. Однако один конкретный шаблон электронной почты вызывает проблему - он извлекает весь HTML и CSS вместо текста. br />
  • Использование IMAP для извлечения электронных писем из Gmail. Mimemessage и извлечение текста с использованием Multipart And Bodypart. проблема: < /strong> < /p>

    Определенный шаблон электронной почты всегда возвращает полный HTML & CSS вместо простого Текст. < /li>
    Другие шаблоны электронной почты извлекают текст, как и ожидалось. Почему процесс извлечения не выполняется для этого.private String extractTextFromMessage(Message message) throws Exception {
    if (message.isMimeType("text/plain")) {
    return message.getContent().toString();
    } else if (message.isMimeType("multipart/*")) {
    Multipart multipart = (Multipart) message.getContent();
    for (int i = 0; i < multipart.getCount(); i++) {
    BodyPart bodyPart = multipart.getBodyPart(i);
    if (bodyPart.isMimeType("text/plain")) {
    return bodyPart.getContent().toString();
    }
    }
    }
    return "No text content found";
    }
    < /code>
    Что я попробовал: < /strong> < /p>

    Убедитесь, что тип контента электронной почты проверяется должным образом. /li>
    итерация через ** Multipart, чтобы найти Text /plain. ** < /li>
    Отладочная необработанное контент электронной почты и обнаружил, что встроенный текст электронной почты Внутри Html или элементы
    .
  • Попроеклся, используя jsoup (jsoup.parse (html) .text ()) для извлечения из HTML, но все еще сталкивается с Проблемы с нежелательным CSS и форматированием.
Вопросы:

Почему эта конкретная электронная почта возвращает полный HTML, в то время как другие возвращают только текст? Текст? бренд /> < /ol>
Любые идеи или предложения были бы полезны и оценены! < /p>

Подробнее здесь: https://stackoverflow.com/questions/794 ... ng-boot-im

Вернуться в «JAVA»