Невозможно загрузить файлы в кластер Cloudera HDFS с использованием IP-адреса узла имени с помощью библиотеки Python.Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Невозможно загрузить файлы в кластер Cloudera HDFS с использованием IP-адреса узла имени с помощью библиотеки Python.

Сообщение Anonymous »

Я использую кластер Cloudera CDP. HDFS установлен в Cloudera. Когда я создаю каталог, он работает. Когда я пытаюсь загрузить файлы в каталог HDFS, я получаю сообщение об ошибке: Не удалось разрешить «ip-172-31-12-191.ap-southeast-2.compute.internal» ([Errno -2] Имя или служба неизвестны )
Код Python:

Код: Выделить всё

from hdfs import InsecureClient

hdfs_url = "http://ec2-54-253-105-121.ap-southeast-2.compute.amazonaws.com:9870"
hdfs_user = "hdfs"
local_file_path = "/content/drive/My Drive/Algotest/NSE_NIFTY_1m.csv"
hdfs_destination = "/div/NSE_NIFTY_1m.csv"  # Destination path in HDFS

# Create the HDFS client
hdfs_client = InsecureClient(hdfs_url, user=hdfs_user)

# Upload the file to HDFS
try:
hdfs_client.upload(hdfs_destination, local_file_path)
print("File uploaded successfully.")

except Exception as e:
print("Error:", e)
Ошибка:

Код: Выделить всё

requests.exceptions.ConnectionError: HTTPConnectionPool(host='ip-172-31-12-191.ap-southeast-2.compute.internal', port=9864): Max retries exceeded with url: /webhdfs/v1/div/NSE_NIFTY_1m.csv?op=CREATE&user.name=hdfs&namenoderpcaddress=ip-172-31-12-150.ap-southeast-2.compute.internal:8020&createflag=&createparent=true&overwrite=false&user.name=hdfs (Caused by NameResolutionError(": Failed to resolve 'ip-172-31-12-191.ap-southeast-2.compute.internal' ([Errno -2] Name or service not known)"))
Error: HTTPConnectionPool(host='ip-172-31-12-191.ap-southeast-2.compute.internal', port=9864): Max retries exceeded with url: /webhdfs/v1/div/NSE_NIFTY_1m.csv?op=CREATE&user.name=hdfs&namenoderpcaddress=ip-172-31-12-150.ap-southeast-2.compute.internal:8020&createflag=&createparent=true&overwrite=false&user.name=hdfs (Caused by NameResolutionError(": Failed to resolve 'ip-172-31-12-191.ap-southeast-2.compute.internal' ([Errno -2] Name or service not known)"))
Я добавил частный IP-адрес и внутренний DNS в /etc/hosts во всех виртуальных машинах кластера Cloudera и перезагружаю виртуальные машины, но проблема все еще возникает.
Ссылка на ссылку: https://github.com/cloudera/impyla/issu ... t-72324276

Подробнее здесь: https://stackoverflow.com/questions/785 ... python-lib
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Загрузка набора данных Ray HDFS: не удалось закрыть HdfsReadableFile: IOError: Ошибка закрытия HDFS. Подробности: [errno
    Anonymous » » в форуме JAVA
    0 Ответы
    58 Просмотры
    Последнее сообщение Anonymous
  • Кластер заданий Flink и кластер сеансов — развертывание и настройка
    Anonymous » » в форуме JAVA
    0 Ответы
    61 Просмотры
    Последнее сообщение Anonymous
  • Как скопировать файлы и папки в HDFS с помощью Pyspark
    Anonymous » » в форуме Python
    0 Ответы
    21 Просмотры
    Последнее сообщение Anonymous
  • Как скопировать файлы и папки в HDFS с помощью Pyspark
    Anonymous » » в форуме Python
    0 Ответы
    20 Просмотры
    Последнее сообщение Anonymous
  • Как перечислить все файлы по пути, используя библиотеку hdfs в Python?
    Anonymous » » в форуме Python
    0 Ответы
    10 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»