Код: Выделить всё
~/
testdir/
docker-compose.yml
pipeline/
requirements.txt
dockerfiles/
Dockerfile
testfile.py
Код: Выделить всё
services:
scrapers:
build:
context: .
dockerfile: pipeline/dockerfiles/Dockerfile
container_name: scrapers
image: scrapers
volumes:
- .:/testdir
- ~/.gitconfig:/etc/gitconfig
command: tail -F anything
Код: Выделить всё
FROM ubuntu:jammy
WORKDIR /testdir
COPY pipeline/requirements.txt pipeline/requirements.txt
RUN : \
&& apt-get update \
&& DEBIAN_FRONTEND=noninteractive apt-get install \
-y --no-install-recommends \
git \
python3-pip \
&& pip3 install -r pipeline/requirements.txt \
&& :
COPY . /testdir
CMD tail -F anything
Код: Выделить всё
selenium==4.26.0
Код: Выделить всё
from selenium import webdriver
driver = webdriver.Chrome()
driver = webdriver.FireFox()
Код: Выделить всё
> docker compose up scrapers -d --build
> docker exec -it scrapers /bin/bash
- Есть ли лучший образ Docker для этой цели? Если да, могу ли я просто подключить его к существующим файлам/командам, или нужно что-то еще изменить в этом процессе?
- Есть ли есть ли дополнительные установки, которые мне нужно добавить в файл докеров? Если да, то каковы они и каковы наилучшие (минимальные) способы их решения?
- Имеет ли значение, какой браузер я использую? Допустим, я придерживаюсь ubuntu:jammy, тогда, может быть, это и правда, но если я переключусь на другой образ Docker, будет ли это иметь значение? У меня нет каких-либо врожденных предпочтений в отношении используемого драйвера, если я могу собирать с его помощью данные.
- Это вторично по отношению к получению этого процесс действительно работает, но есть ли способ сделать это так, чтобы я мог запускать драйверы Selenium без головы?
Подробнее здесь: https://stackoverflow.com/questions/793 ... b-scraping
Мобильная версия