每天对着一堆纸质文件发愁?发票、合同、手写笔记堆成山,光是录入就耗掉大半天。其实你手里的扫描仪不只是个复印工具,配上几行Python脚本,它立马变身智能文档助手。
从扫描到识别,一步到位
很多人不知道,Python有个叫Pytesseract的库,能直接读取扫描图片里的文字。比如你把一份报销单扫成PDF或JPG,脚本可以自动提取金额、日期和商户名称,再填进Excel里。不用手动敲一个字。
import pytesseract
from PIL import Image
# 打开扫描后的图片
img = Image.open('receipt_001.jpg')
# 识别文字
text = pytesseract.image_to_string(img, lang='chi_sim+eng')
print(text)
这段代码跑完,图片里的中英文内容就变成可编辑的文本了。加个循环,一次处理几十张扫描件也不在话下。
实际场景:家庭账本数字化
我妈每个月都攒着一堆超市小票,想记账又懒得翻。我写了个小脚本,她只要把手机拍的票据照片扔进指定文件夹,程序自动识别金额和时间,生成月度支出统计表。现在她自己都会定期“投喂”照片了。
还能干点别的
除了识字,OpenCV + Python也能帮你自动裁剪扫描图像的边缘。有时候手机拍文档歪了、有阴影,脚本能检测边框,矫正透视,输出一张干净整齐的A4尺寸图,直接打印出来也看不出来是随手拍的。
这些操作不需要编程基础也能上手。安装Tesseract-OCR引擎,pip装个依赖,照着示例改两行路径,大多数家用场景都能覆盖。比起买几百块的商业软件,自己搭一套更灵活,还省了订阅费。
下次扫描前,先想想:这事能不能交给Python?往往写二十行代码,就能省下两小时重复劳动。