MySQL数据库使用需要以下软件:
- MySQL
- pyMySQL
- SQLyog
MySQL数据库 安装
下载 MySQL windows 版本
MySQL 官网:https://www.mysql.com/
打开MySQL windows 下载界面 ,选择第二个文件下载
安装 pysql
方法一: 命令安装 pyMySQL
$ pip install PyMySQL
方法二: Pycharm 安装 pyMySQL
(1) 工具栏 File
→ Setting
→ Project interpreter
(2) 点击“+”号 → 搜索 pyMySQL
→ 点击左下角 Install Package
按钮,安装成功后,如下图所示:
安装 SQLyog
(1)SQLyog 下载
百度云盘 提取码:e9c6
(2)安装成功后,连接 MySQL
实例 爬取起点中文网VIP收藏榜数据
起点中文网VIP收藏榜网站:https://www.qidian.com/rank/vipcollect?style=1
分析
(1)网站地址构造。起点中文网VIP收藏榜共五页,每页25条数据。
第一页:https://www.qidian.com/rank/vipcollect?style=1
第二页:https://www.qidian.com/rank/vipcollect?style=1&page=2
第三页:https://www.qidian.com/rank/vipcollect?style=1&page=3
……
经测试,第一页也可使用https://www.qidian.com/rank/vipcollect?style=1&page=1进行访问。
如此,网页访问可构造为:
1 | urls = ['https://www.qidian.com/rank/vipcollect?style=1&page={}'.format(str(i)) for i in range(1, 6)] |
(2)爬取目标
小说的排名 book_rank
小说的名字 book_name
小说的作者 book_author
小说的分类 book_category
小说的状态 book_status
小说的封面地址 book_img
小说的链接地址 book_url
(3)爬取目标数据提取
本次提取采用 BeautifulSoup,点击谷歌浏览器右键检查
选项,可查找爬取目标数据
1 | # 导入相应的库 |
创建 MySQL 数据库和表
创建 MySQL 数据库和表
- 右键
root@localhost
→创建数据库
- 输入数据库名称
mydb
- 右键
mydb
→表
→创建表
- 输入表名称
qidian_book
,引擎InnoDB
,字符集utf8
,其它默认。 - 输入表的列表名称和数据类型,如下所示,其他默认。
book_rank text
book_name text
book_author text
book_category text
book_status text
book_img text
book_url text
数据提交
1 | # 引入相应的库 |
运行测试
源代码
1 | # -*- coding: UTF-8 –*- |
测试结果
如果SQLyog连接MySQL时出现的2058错误。。。
具体参考:
SQLyog连接MySQL时出现的2058错误解决方法
解决方法:
(1)windows 下cmd 登录 mysql -u root -p 登录你的 mysql 数据库,
(2)然后执行这条SQL命令:
ALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY 'password';其中 #password 是你自己设置的root密码,注意别忘了分号;
(3)然后重新配置SQLyog的连接,则可连接成功了,就OK了。