一共有近2600条类似格式的表格细栏,每个栏目包括的信息有:
-
日期
-
发文单位
-
文号
-
标题
-
签收栏
需要提取其中加粗的这三项内容到Excel表格中存储,表格样式如下:
仔细观察可以发现一个文件条目占据了3行,所以对表格全部行循环迭代时可以设步长为3
注意观察表格,按照row和cell把所需内容解析清楚
2/1
这种 日/月
的形式。我们需要转化成 YYYY-MM-DD
格式,而这利用到datetime
包的strptime
和strftime
函数:-
strptime:
解析字符串中蕴含的时间 -
strftime:
转化成所需的时间格式
openpyxl
线程的最后记得保存
最后附上完整代码,代码很简单,理清思路最重要
● 80%的人都不知道,全球Python库下载前10名
● 我珍藏的一些好的Python代码,技巧|上篇
● 爬取300本Python书籍,用Python告诉你哪家强?
点赞是最大的支持
本篇文章来源于: 菜鸟学Python
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ Python语言如何入门02/24
- ♥ 哪个难学,php还是python09/28
- ♥ 你见过的最全面的 Python 重点04/08
- ♥ 如何在python中打开编辑器08/20
- ♥ 为什么python代码有下划线曲线?08/20
- ♥ 在 python 中使用 OpenCV 绘图11/01
内容反馈