Selenium фиксирует только полные URL-адреса для сценария srcPython

Программы на Python
Ответить
Anonymous
 Selenium фиксирует только полные URL-адреса для сценария src

Сообщение Anonymous »

Я пытаюсь захватить все элементы «src» во всех элементах, но он никогда не возвращает мне URL-адреса типа «/cdn/script.js», а только полные URL-адреса, такие как «site.com/cdn/script.js», как можно я включаю это?

Код: Выделить всё

def GetScriptArray():
ScriptElements = Driver.find_elements(By.TAG_NAME, 'script')
for x, Script in enumerate(ScriptElements, start=1):
ScriptSource = Script.get_attribute("src")
ScriptSourceAlt = Script.get_attribute("data-original-src")
if ScriptSource:
if ScriptSource.startswith("http"):
ScriptArray.append(ScriptSource)
elif ScriptSource.startswith("//"):
print("SPECIAL 1 : " + ScriptSource)
elif ScriptSource.startswith("/"):
print("SPECIAL 2 : " + ScriptSource)
else:
print("SCRIPT NUM " + str(x) + " HAS NO SRC")
Приведенный выше скрипт выводит следующее (я тестирую на Hugedomains.com/domain_profile.cfm?d=myecommercewebsite.com):

Код: Выделить всё

DevTools listening on ws://127.0.0.1:60068/devtools/browser/a7437c3c-2acf-484f-9ec8-92c7fb9acca4
SCRIPT NUM 4 HAS NO SRC
SCRIPT NUM 5 HAS NO SRC
SCRIPT NUM 6 HAS NO SRC
SCRIPT NUM 7 HAS NO SRC
SCRIPT NUM 8 HAS NO SRC
SCRIPT NUM 9 HAS NO SRC
SCRIPT NUM 16 HAS NO SRC
SCRIPT NUM 17 HAS NO SRC
SCRIPT NUM 18 HAS NO SRC
[массив без вырезанных URL-адресов (не могу поделиться, потому что вы не можете публиковать https://]
не находит URL-адресов типа «/cdn» /script,js" только полные URL...........

Подробнее здесь: https://stackoverflow.com/questions/792 ... script-src
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»