python爬取动态下滑加载网页示例,附上源代码!(JD爸爸 我没有攻击你) 您所在的位置:网站首页 动态网页怎么爬取数据 python爬取动态下滑加载网页示例,附上源代码!(JD爸爸 我没有攻击你)

python爬取动态下滑加载网页示例,附上源代码!(JD爸爸 我没有攻击你)

2024-07-11 11:41| 来源: 网络整理| 查看: 265

运行截图: 在这里插入图片描述 等待页面全部加载完成后将html抓取,分析处理后得到想要的数据。 在这里插入图片描述 python源代码:

from os import times from bs4 import BeautifulSoup import urllib.error from selenium.webdriver.common.keys import Keys # 模仿键盘,操作下拉框的 from bs4 import BeautifulSoup # 解析html的 from selenium import webdriver import time def main(): pa() def pa(): # 爬取动态下滑加载网页 options = webdriver.ChromeOptions() options.binary_location = r"D:\Program Files\Google\Chrome\Application\chrome.exe" driver = webdriver.Chrome(chrome_options=options) driver.get("https://food.jd.com") js = ''' let height = 0 let interval = setInterval(() => { window.scrollTo({ top: height, behavior: "smooth" }); height += 500 }, 500); setTimeout(() => { clearInterval(interval) }, 7000); ''' driver.execute_script(js) time.sleep(8) bs = BeautifulSoup(driver.page_source, "html.parser") driver.close() list = bs.select(".goods-item__title") for i in range(len(list)): list[i] = list[i].get_text() print("%s\n" % list[i]) if __name__ == "__main__": main()

仅教学用,无攻击行为或意向。

有疑问留下评论,当日必回。

感谢阅读~~~



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有