Я считаю, что сравниваю яблоки с яблоками, потому что:
- В каждом случае я анализирую один и тот же PDF-документ.
- Поскольку приложение Streamlit размещено локально, все вычисления выполняются на процессоре моего ноутбука. Я не использую виртуальные ресурсы Hugging Face. Модели HF загружаются на мой компьютер.
- Jupyter Notebook также работает локально на моем компьютере.
- Файл .py. генерируется из блокнота Jupyter с использованием «streamlit-juypter», который просто берет код Python из блокнота и добавляет несколько операторов Streamlit.
Единственные различия, которые я могу придумать, могут объяснить это:
- Streamlit запускает файл Python .py из командной строки вместо блокнота .ipynb
- Streamlit работает внутри виртуальной среды вместо моего основного Python установка
Изменить: как предложил @Wayne, я сравнил выходные данные pip list< /code> между моей основной установкой Python и venv и обнаружил некоторые различия. Поэтому я обновил все основные пакеты, используемые задачей НЛП, до последних версий, и теперь время выполнения осталось прежним. Хотя я до сих пор не знаю, какой пакет виноват, и, вероятно, сейчас это не имеет значения.
Сравнение версий пакетов в MS Excel

Подробнее здесь: https://stackoverflow.com/questions/782 ... command-li