Понимание доступа к файлам в файловой системе Databricks (DBFS) и томах с помощью Python и Spark

Понимание доступа к файлам в файловой системе Databricks (DBFS) и томах с помощью Python и Spark ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Понимание доступа к файлам в файловой системе Databricks (DBFS) и томах с помощью Python и Spark

Цитата

Сообщение Anonymous » 05 авг 2024, 11:43

В настоящее время я пытаюсь прочитать и отобразить файл из файловой системы Databricks (DBFS), но столкнулся с проблемой. Вот код, который я использовал:

Код: Выделить всё

file_path = "/dbfs/cluster-logs/use_case/default_job_cluster/cluster_id/init_scripts/cluster_id/20240801_proxy-init.sh.stderr.log"

with open(file_path, 'r') as file:
contents = file.read()
print(contents)

Однако, что интересно, я получаю следующую ошибку:

Код: Выделить всё

bash: line 11: /Volumes/landing/default/artifacts/projects/use_case/databricks/scripts/proxy-init.sh: No such file or directory

Как видите, путь не соответствует исходному вводу.
В конце концов мне удалось правильно прочитать и отобразить содержимое файла журнала с помощью следующего кода:< /p>

Код: Выделить всё

file_path = "/dbfs/cluster-logs/use_case/default_job_cluster/cluster_id/init_scripts/cluster_id/20240801_proxy-init.sh.stderr.log"

from pyspark.sql import functions as F
from pyspark.sql.functions import collect_list

if dbutils.fs.ls(file_path):
file_df_to_check = spark.read.text(file_path).agg(collect_list("value").alias("all_lines"))
display(file_df_to_check)

Вопросы:

Почему первый фрагмент кода выдает ошибку, ссылающуюся на путь к тому?
Что в документации означает, что DBFS предоставляет схему для томов? Разве первый фрагмент не должен работать?
Почему файл можно прочитать только с помощью Spark, а не с помощью стандартной функции открытия Python?

Спасибо за помощь.

Подробнее здесь: https://stackoverflow.com/questions/788 ... mes-with-p

1722847436

Anonymous

В настоящее время я пытаюсь прочитать и отобразить файл из файловой системы Databricks (DBFS), но столкнулся с проблемой. Вот код, который я использовал:
[code]file_path = "/dbfs/cluster-logs/use_case/default_job_cluster/cluster_id/init_scripts/cluster_id/20240801_proxy-init.sh.stderr.log"

with open(file_path, 'r') as file:
contents = file.read()
print(contents)
[/code]
Однако, что интересно, я получаю следующую ошибку:
[code]bash: line 11: /Volumes/landing/default/artifacts/projects/use_case/databricks/scripts/proxy-init.sh: No such file or directory
[/code]
Как видите, путь не соответствует исходному вводу.
В конце концов мне удалось правильно прочитать и отобразить содержимое файла журнала с помощью следующего кода:< /p>
[code]file_path = "/dbfs/cluster-logs/use_case/default_job_cluster/cluster_id/init_scripts/cluster_id/20240801_proxy-init.sh.stderr.log"

from pyspark.sql import functions as F
from pyspark.sql.functions import collect_list

if dbutils.fs.ls(file_path):
file_df_to_check = spark.read.text(file_path).agg(collect_list("value").alias("all_lines"))
display(file_df_to_check)
[/code]
Вопросы:
[list]
[*]Почему первый фрагмент кода выдает ошибку, ссылающуюся на путь к тому?
[*]Что в документации означает, что DBFS предоставляет схему для томов? Разве первый фрагмент не должен работать?
[*]Почему файл можно прочитать только с помощью Spark, а не с помощью стандартной функции открытия Python?
[/list]
Спасибо за помощь. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78820957/understanding-file-access-in-databricks-file-system-dbfs-versus-volumes-with-p[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как рассчитать уровень dBFS с помощью звукового устройства Python

Последнее сообщение Anonymous « 09 дек 2024, 15:56
Добавлено в форуме Python

Anonymous » 09 дек 2024, 15:56 » в форуме Python

Я пытаюсь получить значение децибел из аудиопотока с помощью библиотеки sounddevice.
Более конкретно, я хочу отображать текущий уровень в DAW, например мода.
В соответствии с этим большинство DAW отображают на своих индикаторах уровни dBFS или LUFS...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
09 дек 2024, 15:56
Soundpool Soundpool Soundpool в разных томах

Последнее сообщение Anonymous « 21 фев 2025, 19:03
Добавлено в форуме Android

Anonymous » 21 фев 2025, 19:03 » в форуме Android

У меня очень странная проблема, которую я не могу понять. У меня есть звуковая точка, инициализированная одним звуком (очень короткий звук «щелкнуть»). В моем обработке OnClick для моих кнопок активности я делаю простой SoundManager.PlaySound (1,...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
21 фев 2025, 19:03
Оболочка Spark: spark.executor.extraJavaOptions не разрешено устанавливать параметры Spark.

Последнее сообщение Anonymous « 24 сен 2024, 08:55
Добавлено в форуме Python

Anonymous » 24 сен 2024, 08:55 » в форуме Python

Я создал эту программу Spark Shell, но при ее запуске возникла ошибка:
Windows PowerShell
Copyright (C) Microsoft Corporation. All rights reserved.

Install the latest PowerShell for new features and improvements!

PS...

0 Ответы

52 Просмотры

Последнее сообщение Anonymous
24 сен 2024, 08:55
Доступ к файлам в рабочей области Databricks в версии среды выполнения > 11.3 с помощью Python

Последнее сообщение Anonymous « 25 дек 2024, 19:53
Добавлено в форуме Python

Anonymous » 25 дек 2024, 19:53 » в форуме Python

У меня вопрос о том, можно ли получить доступ (чтение и запись) к файлам в общей рабочей области в Databricks с помощью Python? Я знаю, что согласно документам «В Databricks Runtime 11.3 LTS и выше вы можете напрямую манипулировать файлами рабочей...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
25 дек 2024, 19:53
Databricks не может найти файл csv внутри колеса, которое я установил при запуске из блокнота Databricks.

Последнее сообщение Anonymous « 31 мар 2024, 17:51
Добавлено в форуме Python

Anonymous » 31 мар 2024, 17:51 » в форуме Python

Я изучаю Spark, поэтому в качестве задачи нам нужно было создать колесо локально, а затем установить его в Databricks (я использую Azure Databricks) и протестировать его, запустив из блокнота Databrick. Эта программа предполагает чтение файла CSV...

0 Ответы

92 Просмотры

Последнее сообщение Anonymous
31 мар 2024, 17:51

Вернуться в «Python»