Python 实战 | 从 PDF 中提取(框线不全的)表格
本文目录 一、引言 二、camelot-py 介绍 三、安装 camelot-py 四、camelot-py 使用方法 五、camelot-py 的其他实用参数 六、结束语 七、相关推荐 本文共7015个字,阅读大约需要18分钟,欢迎指正! 一、引言 社科同胞们一定有过收集/整理数据的经历吧,有时候一些原始数据被存放在大量的 PDF 文件中,例如上市公司公告公报中的各种指标信息,但如何快速地从大量的 PDF 中提取出那些表格却是一个难题。在过往的文章中,我们曾向大家分享过使用 Python 的 pdfplumber 库从 PDF 中读取表格的方法(>>>点击查看“一文读...
最近评论