python用pymysql保存数据到数据库。python3以后不支持MySQLdb形式保存数据到数据库了,可以用pymysql保存数据。下面的例子是从维基百科读取词条,再将词条信息保存到mysql数据库里。
知识点:urllib的使用,beautifulsoup的使用,pymysql的使用
截图如下

python用pymysql保存数据到数据库。python3以后不支持MySQLdb形式保存数据到数据库了,可以用pymysql保存数据。下面的例子是从维基百科读取词条,再将词条信息保存到mysql数据库里。

from urllib.request import urlopen
from bs4 import BeautifulSoup
import re
import pymysql.cursors
resp = urlopen("https://en.wikipedia.org/wiki/Main_Page").read().decode('utf-8')
soup = BeautifulSoup(resp,"html.parser")
listUrls = soup.find_all('a',href=re.compile("^/wiki/"))
for url in listUrls:
if not re.search("\.(jpg|JPG)$",url['href']):
print(url.get_text(),"---------------",url['href'])
conn = pymysql.connect(
host='127.0.0.1',
port=3306,
user='root',
passwd='123',
db='wikiurl',
charset='utf8mb4'
)
try:
with conn.cursor() as cursor:
sql = "insert into `urls`(`urlname`,`urlhref`)VALUES (%s,%s)"
cursor.execute(sql,(url.get_text(),"https://en.wikipedia.org"+url['href']))
conn.commit()
finally:
conn.close()