Я новичок в программировании и столкнулся с (вероятно, очень небольшим) препятствием во время работы над проектом. По сути, у меня есть папка, полная отдельных квитанций, преобразованных в файлы .json, и мне нужно выполнить довольно простой анализ данных (т. е. проанализировать общие затраты и общий объем продаж каждого бизнеса, чтобы рассчитать прибыль, простая математика)
Все файлы .json имеют базовый формат с некоторыми различиями в количестве типов оплаты/купленных продуктов/примененных рекламных акций:
Изначально я пытался просто создать CSV-файл со всеми квитанциями, чтобы можно было с ним поиграться, но в итоге получилось довольно неуклюже. Я использовал следующий код:
import pandas as pd
import json
import pathlib
data_path = pathlib.Path('./receipts-json')
keys = ['Business', 'Cashier', 'Date','GST', 'Payments', 'Products', 'Promotions', 'Reference', 'Sequence', 'Terminal', 'Total']
dat = dict([(k, []) for k in keys])
for jfile in data_path.glob('*.json'):
with jfile.open('r') as ifile:
json_data = json.load(ifile)
for key in keys:
dat[key].append(json_data.get(key, None))
result = pd.DataFrame.from_dict(dat)
result.to_csv('result.csv')
В результате все элементы в разделе «Платежи» (например) будут помещены в один столбец, а не разделены по методу, сумме и т. д. Я знаю, что мог бы просмотреть и разбить все это на отдельные столбцы, но мне кажется, что мне не хватает гораздо более простого способа сделать это, который также позволил бы четко разделить все подгруппы. Любая помощь приветствуется!
Я новичок в программировании и столкнулся с (вероятно, очень небольшим) препятствием во время работы над проектом. По сути, у меня есть папка, полная отдельных квитанций, преобразованных в файлы .json, и мне нужно выполнить довольно простой анализ данных (т. е. проанализировать общие затраты и общий объем продаж каждого бизнеса, чтобы рассчитать прибыль, простая математика) Все файлы .json имеют базовый формат с некоторыми различиями в количестве типов оплаты/купленных продуктов/примененных рекламных акций: [code]{'Business': {'Business number': '123 45 67', 'Name': 'Business Name'}, 'Cashier': 'Cashier name', 'Date': 'YYYY/MM/DD', 'GST': 0.00, 'Payments': [{'Amount': 0.00, 'Method 1': 'Payment method 1'}, {'Amount': 00.00, 'Method': 'Payment Method 2'}], 'Products': [{'Cost': 00.0, 'Name': 'Product name 1', 'Price': 00.0, 'Quantity': x}, {'Cost': 0.0, 'Name': 'Product name 2', 'Price': 0.0, 'Quantity': x}], 'Promotions': [{'Discount': 0.00, 'Per_Quantity': x, 'Product': 'Product applicable for promotion'}], 'Reference': '1234567:123456:12345', 'Sequence': 123, 'Terminal': 0, 'Total': 00.0}
[/code] Изначально я пытался просто создать CSV-файл со всеми квитанциями, чтобы можно было с ним поиграться, но в итоге получилось довольно неуклюже. Я использовал следующий код: [code]import pandas as pd import json import pathlib
data_path = pathlib.Path('./receipts-json') keys = ['Business', 'Cashier', 'Date','GST', 'Payments', 'Products', 'Promotions', 'Reference', 'Sequence', 'Terminal', 'Total'] dat = dict([(k, []) for k in keys])
for jfile in data_path.glob('*.json'): with jfile.open('r') as ifile: json_data = json.load(ifile) for key in keys: dat[key].append(json_data.get(key, None))
result = pd.DataFrame.from_dict(dat) result.to_csv('result.csv') [/code] В результате все элементы в разделе «Платежи» (например) будут помещены в один столбец, а не разделены по методу, сумме и т. д. Я знаю, что мог бы просмотреть и разбить все это на отдельные столбцы, но мне кажется, что мне не хватает гораздо более простого способа сделать это, который также позволил бы четко разделить все подгруппы. Любая помощь приветствуется!
Я хочу разместить некоторые шрифты локально, которые раньше использовал из Google Fonts.
Я заметил, что все справочные статьи указывают на google-webfonts-helper, но результат совсем другой. p>
При использовании Google Fonts загружался один файл...
Например, у меня есть номер 123,429. Как я могу удалить зацепленные десятичные десятики без округления до двух десятичных знаков. Следовательно, мне нужно, чтобы число было до одной десятичной точки, то есть 123.4
-0.5 to -0.58 to -0.5(output)...
У меня есть фрейм данных, который содержит следующую структуру:
А мне нужно проверить, присутствуют ли строки из столбца Имя из столбцов МНЕМОНИКА 1, 2, 3 и так далее, по контрольному списку, имеющему следующий формат:
p>
У меня есть фрейм данных, который содержит следующую структуру:
А мне нужно проверить, присутствуют ли строки из столбца Имя из столбцов МНЕМОНИКА 1, 2, 3 и так далее, по контрольному списку, имеющему следующий формат:
p>