Важность Pydoop в аналитике больших данных и науке о данных

Важность Pydoop в аналитике больших данных и науке о данных ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Важность Pydoop в аналитике больших данных и науке о данных

Цитата

Сообщение Anonymous » 17 ноя 2024, 10:11

Я новичок в области науки о данных и платформах больших данных.

Предположим, у меня есть входные данные DataSet в формате CSV.

Что я нашел в Google и других ресурсах о ежедневная работа аналитика данных и специалиста по данным.

Как только пользователь получит DataSet, сначала он будет манипулировать им с помощью библиотеки Python Pandas, которая включает в себя очистку данных и другие вещи.
Затем пользователь визуализирует данные с помощью matplotlib и других методов.
Пользователь может написать алгоритмы машинного обучения, чтобы получить прогноз по некоторым критериям.

Все вышеперечисленные рабочие процессы можно объединить в анализ данных и прогнозирование.

С другой стороны, я обнаружил, что Pydoop (фреймворк Hadoop на Python)
выполняет такие операции, как хранение, обработка и т. д.

Я немного запутался. , в упомянутом выше рабочем процессе анализа данных, где конкретно находится pydoop?

Пожалуйста, подскажите мне.

Подробнее здесь: https://stackoverflow.com/questions/516 ... ta-science

1731827467

Anonymous

Я новичок в области науки о данных и платформах больших данных.

Предположим, у меня есть входные данные DataSet в формате CSV.

Что я нашел в Google и других ресурсах о ежедневная работа аналитика данных и специалиста по данным.

[list]
[*]Как только пользователь получит DataSet, сначала он будет манипулировать им с помощью библиотеки Python Pandas, которая включает в себя очистку данных и другие вещи.
[*]Затем пользователь визуализирует данные с помощью matplotlib и других методов.
[*]Пользователь может написать алгоритмы машинного обучения, чтобы получить прогноз по некоторым критериям.
[/list]

Все вышеперечисленные рабочие процессы можно объединить в анализ данных и прогнозирование.

С другой стороны, я обнаружил, что Pydoop (фреймворк Hadoop на Python)
выполняет такие операции, как хранение, обработка и т. д.

Я немного запутался. , в упомянутом выше рабочем процессе анализа данных, где конкретно находится pydoop?

Пожалуйста, подскажите мне.

Подробнее здесь: [url]https://stackoverflow.com/questions/51678650/importance-of-pydoop-in-bigdata-analytics-and-data-science[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»