博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python数据库实践
阅读量:4974 次
发布时间:2019-06-12

本文共 981 字,大约阅读时间需要 3 分钟。

一、代码详情

import requestsfrom bs4 import BeautifulSoupalluniv = []def getHTMLText(url):    try:        r = requests.get(url,timeout = 30)        r.raise_for_status()        r.encoding = 'utf-8'        return r.text    except:        return "error"def fillunivlist(soup):    data=soup.find_all('tr')    for tr in data:        ltd =tr.find_all('td')        if len(ltd)==0:            continue        singleuniv=[]        for td in ltd:            singleuniv.append(td.string)        alluniv.append(singleuniv)def printunivlist(num):    print("{:^4}{:^10}{:^5}{:^8}{:^10}".format("排名","学校名字","省份","总分","培养规模"))    for i in range(num):        u=alluniv[i]        print("{:^4}{:^10}{:^5}{:^8}{:^10}".format(u[0],u[1],u[2],u[3],u[6]))def main(num):    url = "http://www.zuihaodaxue.cn/zuihaodaxuepaiming2019.html"    html=getHTMLText(url)    soup=BeautifulSoup(html,"html.parser")    fillunivlist(soup)    printunivlist(num)main(100)

 

转载于:https://www.cnblogs.com/asd516970982/p/10947188.html

你可能感兴趣的文章
更新.net core 3.0,dotnet ef命令无法使用的解决办法
查看>>
React躬行记(13)——React Router
查看>>
前端利器躬行记(1)——npm
查看>>
前端利器躬行记(2)——Babel
查看>>
前端利器躬行记(6)——Fiddler
查看>>
Forbidden You don't have permission to access / on this server.
查看>>
Intellij Idea新建web项目(转)
查看>>
用JAVA编写浏览器内核之实现javascript的document对象与内置方法
查看>>
centos iptables
查看>>
unity3d 移动与旋转 2
查看>>
寻找二叉查找树中比指定值小的所有节点中最大的那个节点
查看>>
如何设置输入框达到只读效果
查看>>
RT3070 USB WIFI 在连接socket编程过程中问题总结
查看>>
MIS外汇平台荣获“2013年全球最佳STP外汇交易商”
查看>>
LeetCode 题解之Add Digits
查看>>
hdu1502 , Regular Words, dp,高精度加法
查看>>
20120227_CET6
查看>>
SpringBoot在idea中的热部署配置
查看>>
MyEclipse连接SQL Server 2008数据库的操作方法
查看>>
leetcode【67】-Bulb Switcher
查看>>