Как сделать хорошие воспроизводимые примеры пандPython

Программы на Python
Ответить
Anonymous
 Как сделать хорошие воспроизводимые примеры панд

Сообщение Anonymous »

Потратив приличное количество времени на просмотр тегов r и pandas Что касается SO, у меня сложилось впечатление, что вопросы pandas с меньшей вероятностью содержат воспроизводимые данные. Это то, что сообщество R очень хорошо поощряет, и благодаря таким руководствам новички могут получить некоторую помощь в составлении этих примеров. Людям, которые смогут прочитать эти руководства и вернуться с воспроизводимыми данными, зачастую будет гораздо легче получить ответы на свои вопросы.
Как мы можем создать хорошие воспроизводимые примеры для вопросов о пандах? Можно объединить простые фреймы данных, например:

Код: Выделить всё

import pandas as pd
df = pd.DataFrame({'user': ['Bob', 'Jane', 'Alice'],
'income': [40000, 50000, 42000]})
Но многие примеры наборов данных требуют более сложной структуры, например:
  • Код: Выделить всё

    datetime
    индексы или данные
  • Несколько категориальных переменных (существует ли эквивалент функции Rexpand.grid(), которая создает все возможные комбинации некоторых заданных переменных?)
  • Данные MultiIndex
Для наборов данных, которые трудно смоделировать с помощью нескольких строк кода, существует ли эквивалент функции R dput(), которая позволяет сгенерировать код, допускающий копирование и вставку, для регенерации вашей структуры данных?

Подробнее здесь: https://stackoverflow.com/questions/201 ... s-examples
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»