Apache Tika Server v2 не раскрывает конечные точки Async или PipesJAVA

Программисты JAVA общаются здесь
Ответить Пред. темаСлед. тема
Anonymous
 Apache Tika Server v2 не раскрывает конечные точки Async или Pipes

Сообщение Anonymous »

Моя цель — использовать сервер Tika для получения URL-адреса источника/назначения S3 для асинхронного анализа различных типов файлов. Используя это руководство в качестве отправной точки, я запустил сервер Tika (2.9.2), работающий локально с помощью Docker, но я не вижу конечных точек /async или /pipes. Я не ожидаю, что они будут работать локально без корзины, и это нормально, но я ожидаю, что конечная точка хотя бы появится. Это взято из их документации по tika-pipes.
Это единственные журналы, которые я получаю при запуске, а конечные точки /async и /pipes возвращают ошибки 404. Главная домашняя страница выглядит нормально, но на ней не показаны маршруты, которые я ищу.
Изображение
.
Я предполагаю, что либо мне нужно явно указать эти конечные точки, либо он не распознает принесенные мной jar-файлы и, следовательно, не загружает их автоматически. Или, может быть, что-то еще, чего я не понимаю в файле конфигурации.
Любые указания приветствуются!
Мой tika-config.xml:








true




./config/tika-config.xml




1000000





s3f
us-east-1
tika-bucket
instance
false
false
100






s3e
us-east-1
instance
tika-bucket
json
true





dockerfile (я удалил из этой части несколько строк, которые были только что загруженными зависимостями, они есть в руководстве, указанном выше):
FROM ubuntu:focal as base
RUN apt-get update

ENV TIKA_VERSION 2.9.2
ENV TIKA_SERVER_JAR tika-server-standard

FROM base as dependencies

RUN DEBIAN_FRONTEND=noninteractive apt-get update && apt-get -y install gdal-bin tesseract-ocr \
tesseract-ocr-eng curl gnupg

# Set this environment variable if you need to run OCR
ENV OMP_THREAD_LIMIT=1

RUN apt-get -y install openjdk-17-jdk

FROM dependencies as fetch_tika

# download all the tika dependencies (removed those lines of code for this question)

ENV TIKA_VERSION=$TIKA_VERSION
RUN mkdir /tika-bin
COPY --from=fetch_tika /${TIKA_SERVER_JAR}-${TIKA_VERSION}.jar /tika-bin/${TIKA_SERVER_JAR}-${TIKA_VERSION}.jar
# The extra dependencies need to be added into tika-bin together with the tika-server jar
COPY --from=fetch_tika /tika-fetcher-s3-${TIKA_VERSION}.jar /tika-bin/tika-fetcher-s3-${TIKA_VERSION}.jar
COPY --from=fetch_tika /tika-emitter-s3-${TIKA_VERSION}.jar /tika-bin/tika-emitter-s3-${TIKA_VERSION}.jar
RUN mkdir /config
COPY tika-config.xml /config

EXPOSE 9998
ENTRYPOINT [ "/bin/sh", "-c", "exec java -cp \"/tika-bin/*\" org.apache.tika.server.core.TikaServerCli -h 0.0.0.0 $0 $@"]

Затем создайте + запустите:
docker build --tag 'tika_server_local' .

docker run -d \
--name tika_container \
-v tika_dir:/config \
-p 9998:9998 tika_server_local:latest \
-c ./config/tika-config.xml


Подробнее здесь: https://stackoverflow.com/questions/791 ... -endpoints
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «JAVA»