В настоящее время я использую скрипт Python для получения твитов из потока Twitter и отправки их в индекс Elasticsearch. Мой следующий шаг — попытаться создать некоторую форму защиты, которая останавливает процесс потоковой передачи, когда индекс достигает желаемого размера файла (скажем, 2 ГБ). Я получил размер хранилища в байтах, но этот размер резко уменьшается после завершения потоковой передачи (с моими ограниченными знаниями я предполагаю, что Elasticsearch оптимизирует индекс), в результате чего у меня фактически получается размер файла меньше желаемого.
Есть ли какой-нибудь надежный способ узнать точный размер файла и использовать его как способ остановить поток?
Моя первоначальная идея должен был прекратить трансляцию после определенного количества твитов, но это ненадежно, поскольку каждый твит имеет разный размер, что не дает надежного способа убедиться, что он не превышает размер файла.
Подробнее здесь: https://stackoverflow.com/questions/421 ... -in-python
Как надежно получить размер индекса Elasticsearch в Python ⇐ Python
Программы на Python
-
Anonymous
1736332460
Anonymous
В настоящее время я использую скрипт Python для получения твитов из потока Twitter и отправки их в индекс Elasticsearch. Мой следующий шаг — попытаться создать некоторую форму защиты, которая останавливает процесс потоковой передачи, когда индекс достигает желаемого размера файла (скажем, 2 ГБ). Я получил размер хранилища в байтах, но этот размер резко уменьшается после завершения потоковой передачи (с моими ограниченными знаниями я предполагаю, что Elasticsearch оптимизирует индекс), в результате чего у меня фактически получается размер файла меньше желаемого.
Есть ли какой-нибудь надежный способ узнать точный размер файла и использовать его как способ остановить поток?
Моя первоначальная идея должен был прекратить трансляцию после определенного количества твитов, но это ненадежно, поскольку каждый твит имеет разный размер, что не дает надежного способа убедиться, что он не превышает размер файла.
Подробнее здесь: [url]https://stackoverflow.com/questions/42158504/how-to-reliably-get-elasticsearch-index-size-in-python[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия