Python用selenium爬取淘宝美食信息

Python用selenium爬取淘宝美食信息

先奉上代码:# 如果使用PhantomJS则selenium版本只能2.48.0及以下 from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdrive...

Python 2020-03-09 AM 1728次 0条
Python分析Ajax请求抓取今日头条街拍美图

Python分析Ajax请求抓取今日头条街拍美图

结果如下:程序运行结果"C:\Program Files\Python\Python38\python.exe" E:/PycharmProjects/test/爬虫/今日头条街拍/Spider.py 请求文章详情页出错 None 正在下载1d47b4dceb635bff92ef296ce530cdc2.jpg 正在下载bff2d27b1d4ed77cc0a575513b...

Python 2020-03-08 PM 1978次 0条
Python用正则爬取猫眼之Top100榜的电影信息

Python用正则爬取猫眼之Top100榜的电影信息

爬取信息的主要出处</dd> <dd> <i class="board-index board-index-2">2</i> <a href="/films/1297" title="肖申克的救赎&qu...

Python 2020-03-06 PM 1748次 0条
Python用正则爬取豆瓣读书之新书速递的书籍信息

Python用正则爬取豆瓣读书之新书速递的书籍信息

新书速递的书籍信息数据的主要采集出处<li class=""> <div class="cover"> <a href="https://book.douban.com/subject/34863428/?icn=index-latestbook-subject...

Python 2020-03-05 PM 2137次 0条
Python爬取豆瓣读书Top100的书籍信息

Python爬取豆瓣读书Top100的书籍信息

爬取豆瓣读书Top100的书籍信息(实则只有79本书)import requests import json from lxml import etree import re import time class Spider: def __init__(self): self.url_temp = 'https://www.douban.com/doulist/11...

Python 2020-03-02 PM 1839次 0条
正则表达式总结(Java描述)

正则表达式总结(Java描述)

基础. 匹配除换行符之外的任意字符 \w [a-zA-Z0-9_] \W [^a-zA-Z0-9_] \d [0-9] \D [^0-9] \s 匹配任意一位空白符(\n,\t等) \S 匹配任意一位非空白符 ^ 匹配字符串的开始 $ 匹配字符串的结束 \b 匹配一个单词的边界,即字与空格间的位置。 \B 匹配非单词边界 单词边界是单词和空格之间的位置。非单词...

Java 2020-03-02 PM 1899次 0条
召唤看板娘