Почему питранды возвращают разные значения, чем пользовательский интерфейс Google Trends даже после нормализации? - Цифровое Кемерово

Почему питранды возвращают разные значения, чем пользовательский интерфейс Google Trends даже после нормализации? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Почему питранды возвращают разные значения, чем пользовательский интерфейс Google Trends даже после нормализации?

Цитата

Сообщение Anonymous » 03 июл 2025, 12:23

Я использую библиотеку Pytrends Python, чтобы собрать данные о интересах для списка фильмов из нескольких стран. Тем не менее, значения, которые я получаю в результирующем DataFrame, часто отличаются от того, что я вижу в веб-интерфейсе Google Trends, даже несмотря на то, что сроки, регион и ключевые слова точно такие же. Я также устанавливаю пользовательские заголовки, чтобы избежать 429 ошибок. UI. < /P>
Вот код: < /p>
import pandas as pd
from pytrends.request import TrendReq as UTrendReq
import time
import random
from functools import reduce

REFERENCE_MOVIE = "Gone with the Wind"
movies = [
"Gone with the Wind",
"Casablanca",
"The Godfather",
"Citizen Kane",
"The Sound of Music",
"12 Angry Men",
"Psycho",
"Singin' in the Rain"
]
movies_nonref = [m for m in movies if m != REFERENCE_MOVIE]

countries = {
"US": "United States",
"FR": "France",
"GB": "United Kingdom"
}

category = 0
timeframe = "today 5-y"
gprop = ""

class TrendReq(UTrendReq):
def _get_data(self, url, method='get', trim_chars=0, **kwargs):
headers = {
'accept': 'application/json, text/plain, */*',
'accept-language': 'en-US,en;q=0.9',
'content-type': 'application/json;charset=UTF-8',
'origin': 'https://trends.google.com',
'referer': 'https://trends.google.com/trends/',
'user-agent': 'Mozilla/5.0'
}
return super()._get_data(url, method=method, trim_chars=trim_chars, headers=headers, **kwargs)

pytrends = TrendReq(hl='en-US', tz=360)

def chunk(lst, n):
for i in range(0, len(lst), n):
yield lst[i:i + n]

all_dfs = []

for country_code, country_name in countries.items():
batches = list(chunk(movies_nonref, 4))
for batch in batches:
batch_movies = [REFERENCE_MOVIE] + batch
for attempt in range(3):
try:
pytrends.build_payload(batch_movies, cat=category, timeframe=timeframe, geo=country_code, gprop=gprop)
df = pytrends.interest_over_time().drop(columns=['isPartial'], errors='ignore')
df = df.rename(columns={movie: f"{movie}: ({country_name})" for movie in batch_movies})
df = df.reset_index()
all_dfs.append(df)
break
except Exception as e:
if attempt < 2:
time.sleep(random.uniform(5, 10))
time.sleep(random.uniform(5, 10))

if all_dfs:
result = reduce(lambda left, right: pd.merge(left, right, on="date", how="outer"), all_dfs)
result = result.rename(columns={"date": "Week"})

movie_row = [""] + [col.split(": (")[0] for col in result.columns if col != "Week"]
country_row = ["Week"] + [col.split(": (")[1][:-1] for col in result.columns if col != "Week"]

final_df = pd.DataFrame([movie_row, country_row], columns=result.columns)
final_df = pd.concat([final_df, result], ignore_index=True)

final_df.to_csv("movie_trends_interest_over_time.csv", header=False, index=False)
else:
print("No data collected.")

Подробнее здесь: https://stackoverflow.com/questions/796 ... fter-norma

Реклама

1751534587

Anonymous

 Я использую библиотеку Pytrends Python, чтобы собрать данные о интересах для списка фильмов из нескольких стран. Тем не менее, значения, которые я получаю в результирующем DataFrame, часто отличаются от того, что я вижу в веб-интерфейсе Google Trends, даже несмотря на то, что сроки, регион и ключевые слова точно такие же. Я также устанавливаю пользовательские заголовки, чтобы избежать 429 ошибок. UI. < /P>
Вот код: < /p>
import pandas as pd
from pytrends.request import TrendReq as UTrendReq
import time
import random
from functools import reduce

REFERENCE_MOVIE = "Gone with the Wind"
movies = [
"Gone with the Wind",
"Casablanca",
"The Godfather",
"Citizen Kane",
"The Sound of Music",
"12 Angry Men",
"Psycho",
"Singin' in the Rain"
]
movies_nonref = [m for m in movies if m != REFERENCE_MOVIE]

countries = {
"US": "United States",
"FR": "France",
"GB": "United Kingdom"
}

category = 0
timeframe = "today 5-y"
gprop = ""

class TrendReq(UTrendReq):
def _get_data(self, url, method='get', trim_chars=0, **kwargs):
headers = {
'accept': 'application/json, text/plain, */*',
'accept-language': 'en-US,en;q=0.9',
'content-type': 'application/json;charset=UTF-8',
'origin': 'https://trends.google.com',
'referer': 'https://trends.google.com/trends/',
'user-agent': 'Mozilla/5.0'
}
return super()._get_data(url, method=method, trim_chars=trim_chars, headers=headers, **kwargs)

pytrends = TrendReq(hl='en-US', tz=360)

def chunk(lst, n):
for i in range(0, len(lst), n):
yield lst[i:i + n]

all_dfs = []

for country_code, country_name in countries.items():
batches = list(chunk(movies_nonref, 4))
for batch in batches:
batch_movies = [REFERENCE_MOVIE] + batch
for attempt in range(3):
try:
pytrends.build_payload(batch_movies, cat=category, timeframe=timeframe, geo=country_code, gprop=gprop)
df = pytrends.interest_over_time().drop(columns=['isPartial'], errors='ignore')
df = df.rename(columns={movie: f"{movie}: ({country_name})" for movie in batch_movies})
df = df.reset_index()
all_dfs.append(df)
break
except Exception as e:
if attempt < 2:
time.sleep(random.uniform(5, 10))
time.sleep(random.uniform(5, 10))

if all_dfs:
result = reduce(lambda left, right: pd.merge(left, right, on="date", how="outer"), all_dfs)
result = result.rename(columns={"date": "Week"})

movie_row = [""] + [col.split(": (")[0] for col in result.columns if col != "Week"]
country_row = ["Week"] + [col.split(": (")[1][:-1] for col in result.columns if col != "Week"]

final_df = pd.DataFrame([movie_row, country_row], columns=result.columns)
final_df = pd.concat([final_df, result], ignore_index=True)

final_df.to_csv("movie_trends_interest_over_time.csv", header=False, index=False)
else:
print("No data collected.")
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79688468/why-does-pytrends-return-different-values-than-google-trends-ui-even-after-norma[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему питранды возвращают разные значения, чем пользовательский интерфейс Google Trends даже после нормализации?

Последнее сообщение Anonymous « 03 июл 2025, 10:53
Добавлено в форуме Python

Anonymous » 03 июл 2025, 10:53 » в форуме Python

Я использую библиотеку Pytrends Python, чтобы собрать данные о интересах для списка фильмов из нескольких стран. Тем не менее, значения, которые я получаю в полученном рамке данных, часто отличаются от того, что я вижу в веб-интерфейсе Google...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
03 июл 2025, 10:53
Невозможно щелкнуть текст «Исследовать» на сайте Google Trends с помощью Selenium Python.

Последнее сообщение Anonymous « 06 мар 2024, 09:29
Добавлено в форуме Python

Anonymous » 06 мар 2024, 09:29 » в форуме Python

I need to get Google Trends data for past 30 days, past 12 months like that for the purpose of my current project. I'm able to get daily data using Google Trends API. The package has another API called InterestsOverTime but Google is blocking any...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
06 мар 2024, 09:29
Не могу добавить фрагмент JS из Google Trends в HTML -страницу

Последнее сообщение Anonymous « 31 авг 2025, 18:14
Добавлено в форуме Html

Anonymous » 31 авг 2025, 18:14 » в форуме Html

Я пытаюсь добавить сценарий JS, чтобы сделать тренды Google отображаться на HTML -странице. Я выпустил код Embed и превратил его в следующее, что не работает

Подробнее здесь:

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
31 авг 2025, 18:14
Не могу добавить фрагмент JS из Google Trends в HTML -страницу

Последнее сообщение Anonymous « 31 авг 2025, 18:14
Добавлено в форуме Html

Anonymous » 31 авг 2025, 18:14 » в форуме Html

Я пытаюсь добавить сценарий JS, чтобы сделать тренды Google отображаться на HTML -странице. Я выпустил код Embed и превратил его в следующее, что не работает

Подробнее здесь:

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
31 авг 2025, 18:14
Несоответствие между ->created_at и ->value('created_at') в Laravel: почему они возвращают разные значения?

Последнее сообщение Anonymous « 15 янв 2025, 18:18
Добавлено в форуме Php

Anonymous » 15 янв 2025, 18:18 » в форуме Php

Я столкнулся с проблемой в своем приложении Laravel 10 , когда доступ к атрибуту созданного_at непосредственно из экземпляра модели возвращает другое значение , чем при использовании метода value() в той же модели.
В базе данных указана дата...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
15 янв 2025, 18:18

Вернуться в «Python»

Programmiererforum