Стандартная конфигурация с использованием работы Hadoop-AWS 3.4.1 работает, но для этого требуется пакет AWS SDK. Эта единственная зависимость более 530 МБ , что значительно увеличивает размер развертывания моего приложения. Я знаю об открытой проблеме на Jira's Spark, но еще нет решения.
Код: Выделить всё
Py4JJavaError: An error occurred while calling o83.parquet.
: java.lang.NoClassDefFoundError:
software/amazon/awssdk/utils/builder/ToCopyableBuilder
Подробнее здесь: https://stackoverflow.com/questions/797 ... -v2-bundle
Мобильная версия