Текущий ручной процесс
- Войти на сайт
- Перейти через несколько шагов пользовательского интерфейса
- Применить фильтры (идентификатор, диапазон дат, размер страницы)
- Нажмите «Перейти»
- Загрузить файл Excel
При каждой загрузке создается новый файл Excel, поэтому для получения последних данных мне приходится повторять процесс вручную, что приводит к загромождению файлов и необходимости вручную усилий.
Проблемы
- Приложение учитывает состояние и основано на сеансах
- Прямые URL-адреса на внутренние страницы не работают
- Необходимо соблюдать точную последовательность навигации по пользовательскому интерфейсу
- Открытие страниц в новые вкладки могут сделать сеанс недействительным
- Сайт работает медленно, иногда на загрузку результатов уходит несколько минут
- Правильность и надежность важнее скорости
- Нет доступа к серверной части или официальному API
- Мне нужен один файл Excel (или CSV) на моем компьютере, который всегда представляет последние успешно полученные данные
- Надежное автоматическое решение
- Один фиксированный файл Excel (то же имя, то же расположение)
- Файл должен обновляться автоматически каждые N минут
- Нет частичных или поврежденных файлов
- Если сайт не работает или данные недействительны, существующий файл должен оставаться нетронутым
- В идеале каждый раз не требуется ручной вход в систему
Я прошу не полного кода, а архитектурных или дизайнерских подходов, таких как:
- Автоматизация браузера в сравнении с другими методами
- Безопасные способы многократного обновления одного файла
- Обработка медленных веб-приложений с отслеживанием состояния
- Шаблоны для обработки сеансов и обеспечения надежности
Подробнее здесь: https://stackoverflow.com/questions/798 ... sion-based
Мобильная версия