Планирование блокнотов Jupyter с помощью Azure

Планирование блокнотов Jupyter с помощью Azure ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Планирование блокнотов Jupyter с помощью Azure

Цитата

Сообщение Anonymous » 16 сен 2024, 19:53

У меня есть ноутбук, который читает файлы CSV из SharePoint и загружает их в Snowflake. Код отлично работает в моей локальной системе. Я хочу запланировать ежедневную работу этого ноутбука в облаке. Я изучил функции Azure, создал функцию в студии vscode, а также попробовал использовать студию машинного обучения Azure. Это лучшее и экономически эффективное решение для этого. Вот код, который я хочу запланировать.
from office365.runtime.auth.authentication_context import AuthenticationContext
from office365.sharepoint.client_context import ClientContext
from office365.sharepoint.files.file import File
from office365.sharepoint.files.creation_information import FileCreationInformation
# Import necessary modules
import pandas as pd
from io import StringIO
from io import BytesIO
import io
import snowflake
import sqlalchemy
import snowflake.connector
from snowflake.sqlalchemy import URL
from sqlalchemy import create_engine,text
from sqlalchemy.types import String

from office365.runtime.auth.authentication_context import AuthenticationContext
from office365.sharepoint.client_context import ClientContext
from office365.sharepoint.files.file import File
from office365.sharepoint.files.creation_information import FileCreationInformation
# Import necessary modules
import pandas as pd
from io import StringIO
from io import BytesIO
import io
import snowflake
import sqlalchemy
import snowflake.connector
from snowflake.sqlalchemy import URL
from sqlalchemy import create_engine,text
from sqlalchemy.types import String

ctx2 = connect_to_sharepoint(username, password, site_address)

global print_folder_contents
def print_folder_contents(ctx, folder_url):
try:

folder = ctx.web.get_folder_by_server_relative_url(folder_url)
fold_names = []
sub_folders = folder.files #Replace files with folders for getting list of folders
ctx.load(sub_folders)
ctx.execute_query()

for s_folder in sub_folders:

fold_names.append(s_folder.properties["Name"])

return fold_names

except Exception as e:
print('Problem printing out library contents: ', e)

# Function to read a CSV file from SharePoint
def read_csv_from_sharepoint(ctx, file_url):
try:
file = ctx.web.get_file_by_server_relative_url(file_url)
with BytesIO() as file_stream:
file.download(file_stream)
ctx.execute_query()
file_stream.seek(0)
return pd.read_csv(file_stream, dtype=object) # Ensure all columns are read as objects (strings)
except Exception as e:
print(f"Failed to read the file at {file_url}. Error: {e}")
return None

engine = create_engine(
URL(
user,
account,
authenticator='externalbrowser',
database,
schema,
warehouse,
),
connect_args={'connect_timeout': 120 }
)

try:
connection = engine.connect()
with engine.connect() as conn:
results = conn.execute(text('select current_version()')).fetchone()
print(results[0])
df.columns = map(str.upper, df.columns)
# Convert DataFrame columns to VARCHAR
df = df.astype(str)
df.to_sql('scheduler_test'.lower(), con=connection, schema=schema, index=False, if_exists='replace', chunksize=16000)

finally:
connection.close()
engine.dispose()

Подробнее здесь: https://stackoverflow.com/questions/789 ... sing-azure

1726505632

Anonymous

У меня есть ноутбук, который читает файлы CSV из SharePoint и загружает их в Snowflake. Код отлично работает в моей локальной системе. Я хочу запланировать ежедневную работу этого ноутбука в облаке. Я изучил функции Azure, создал функцию в студии vscode, а также попробовал использовать студию машинного обучения Azure. Это лучшее и экономически эффективное решение для этого. Вот код, который я хочу запланировать.
from office365.runtime.auth.authentication_context import AuthenticationContext
from office365.sharepoint.client_context import ClientContext
from office365.sharepoint.files.file import File
from office365.sharepoint.files.creation_information import FileCreationInformation
# Import necessary modules
import pandas as pd
from io import StringIO
from io import BytesIO
import io
import snowflake
import sqlalchemy
import snowflake.connector
from snowflake.sqlalchemy import URL
from sqlalchemy import create_engine,text
from sqlalchemy.types import String

from office365.runtime.auth.authentication_context import AuthenticationContext
from office365.sharepoint.client_context import ClientContext
from office365.sharepoint.files.file import File
from office365.sharepoint.files.creation_information import FileCreationInformation
# Import necessary modules
import pandas as pd
from io import StringIO
from io import BytesIO
import io
import snowflake
import sqlalchemy
import snowflake.connector
from snowflake.sqlalchemy import URL
from sqlalchemy import create_engine,text
from sqlalchemy.types import String

ctx2 = connect_to_sharepoint(username, password, site_address)

global print_folder_contents
def print_folder_contents(ctx, folder_url):
try:

folder = ctx.web.get_folder_by_server_relative_url(folder_url)
fold_names = []
sub_folders = folder.files #Replace files with folders for getting list of folders
ctx.load(sub_folders)
ctx.execute_query()

for s_folder in sub_folders:

fold_names.append(s_folder.properties["Name"])

return fold_names

except Exception as e:
print('Problem printing out library contents: ', e)

# Function to read a CSV file from SharePoint
def read_csv_from_sharepoint(ctx, file_url):
try:
file = ctx.web.get_file_by_server_relative_url(file_url)
with BytesIO() as file_stream:
file.download(file_stream)
ctx.execute_query()
file_stream.seek(0)
return pd.read_csv(file_stream, dtype=object)  # Ensure all columns are read as objects (strings)
except Exception as e:
print(f"Failed to read the file at {file_url}. Error: {e}")
return None

engine = create_engine(
URL(
user,
account,
authenticator='externalbrowser',
database,
schema,
warehouse,
),
connect_args={'connect_timeout': 120 }
)

try:
connection = engine.connect()
with engine.connect() as conn:
results = conn.execute(text('select current_version()')).fetchone()
print(results[0])
df.columns = map(str.upper, df.columns)
# Convert DataFrame columns to VARCHAR
df = df.astype(str)
df.to_sql('scheduler_test'.lower(), con=connection, schema=schema, index=False, if_exists='replace', chunksize=16000)

finally:
connection.close()
engine.dispose()

 

Подробнее здесь: [url]https://stackoverflow.com/questions/78991078/scheduling-jupyter-notebboks-using-azure[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Планирование блокнотов Jupyter с помощью Azure

Последнее сообщение Anonymous « 17 сен 2024, 12:11
Добавлено в форуме Python

Anonymous » 17 сен 2024, 12:11 » в форуме Python

У меня есть ноутбук, который читает файлы CSV из SharePoint и загружает их в Snowflake. Код отлично работает в моей локальной системе. Я хочу запланировать ежедневную работу этого ноутбука в облаке. Я изучил функции Azure, создал функцию в студии...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
17 сен 2024, 12:11
Выполнение блокнотов Jupyter становится серым в коде Visual Studio

Последнее сообщение Anonymous « 28 сен 2024, 20:51
Добавлено в форуме Python

Anonymous » 28 сен 2024, 20:51 » в форуме Python

Я пытаюсь выполнить код Python в коде VS, позволяющем выполнять блокнот Jupyter. Экран выполнения неоднократно становится серым, что делает выходные данные невидимыми для заголовков. Код по-прежнему будет исполняемым.
Любые предложения по устранению...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
28 сен 2024, 20:51
Как настроить VS Code для скрытия или удаления выходных данных ячеек из блокнотов Jupyter

Последнее сообщение Anonymous « 22 ноя 2024, 13:16
Добавлено в форуме Python

Anonymous » 22 ноя 2024, 13:16 » в форуме Python

Я использую VS Code 1.65.2 и мне очень неудобно иметь выходы ячеек моего ноутбука Jupiter. Я знаю, что их можно удалять по одному, но это очень громоздко. Есть ли какая-либо конфигурация, которая скрывает эти ячейки?

Подробнее здесь:

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
22 ноя 2024, 13:16
Выполнение блокнотов Jupyter становится серым в коде Visual Studio

Последнее сообщение Anonymous « 27 ноя 2024, 12:30
Добавлено в форуме Python

Anonymous » 27 ноя 2024, 12:30 » в форуме Python

Я пытаюсь выполнить код Python в коде VS, позволяющем выполнять блокнот Jupyter. Экран выполнения неоднократно становится серым, что делает вывод невидимым для заголовков. Код по-прежнему будет исполняемым.
Любые предложения по устранению этой...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
27 ноя 2024, 12:30
Невозможно автоматически импортировать библиотеки в файлы блокнотов Python и Jupyter.

Последнее сообщение Anonymous « 04 дек 2024, 01:05
Добавлено в форуме Python

Anonymous » 04 дек 2024, 01:05 » в форуме Python

Я не могу понять, почему код VS не отображает предложения по импорту во всплывающем окне или не выполняет автоматический импорт отсутствующих пакетов, как это должно быть.
Версия VSCode: 1.95. 3
Версия Pylance: v2024.11.3
Венв управляется поэзией и...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
04 дек 2024, 01:05

Вернуться в «Python»