Потратив приличное количество времени на просмотр тегов r и pandas Что касается SO, у меня сложилось впечатление, что вопросы pandas с меньшей вероятностью содержат воспроизводимые данные. Это то, что сообщество R очень хорошо поощряет, и благодаря таким руководствам новички могут получить некоторую помощь в составлении этих примеров. Людям, которые смогут прочитать эти руководства и вернуться с воспроизводимыми данными, зачастую будет гораздо легче получить ответы на свои вопросы.
Как мы можем создать хорошие воспроизводимые примеры для вопросов о пандах? Можно объединить простые фреймы данных, например:
Код: Выделить всё
import pandas as pd
df = pd.DataFrame({'user': ['Bob', 'Jane', 'Alice'],
'income': [40000, 50000, 42000]})
Но многие примеры наборов данных требуют более сложной структуры, например:
- индексы или данные
- Несколько категориальных переменных (существует ли эквивалент функции Rexpand.grid(), которая создает все возможные комбинации некоторых заданных переменных?)
- Данные MultiIndex
Для наборов данных, которые трудно смоделировать с помощью нескольких строк кода, существует ли эквивалент функции R dput(), которая позволяет сгенерировать код, допускающий копирование и вставку, для регенерации вашей структуры данных?
Подробнее здесь:
https://stackoverflow.com/questions/201 ... s-examples