用Python脚本搞定扫描图像识别，办公效率翻倍

发布时间：2026-01-22 01:20:44 阅读：329 次

每天对着一堆纸质文件发愁？发票、合同、手写笔记堆成山，光是录入就耗掉大半天。其实你手里的扫描仪不只是个复印工具，配上几行Python 脚本，它立马变身智能文档助手。

从扫描到识别，一步到位

很多人不知道，Python有个叫Pytesseract的库，能直接读取扫描图片里的文字。比如你把一份报销单扫成PDF或JPG，脚本可以自动提取金额、日期和商户名称，再填进Excel里。不用手动敲一个字。

import pytesseract
from PIL import Image

# 打开扫描后的图片
img = Image.open('receipt_001.jpg')

# 识别文字
text = pytesseract.image_to_string(img, lang='chi_sim+eng')

print(text)

这段代码跑完，图片里的中英文内容就变成可编辑的文本了。加个循环，一次处理几十张扫描件也不在话下。

实际场景：家庭账本数字化

我妈每个月都攒着一堆超市小票，想记账又懒得翻。我写了个小脚本，她只要把手机拍的票据照片扔进指定文件夹，程序自动识别金额和时间，生成月度支出统计表。现在她自己都会定期“投喂”照片了。

还能干点别的

除了识字，OpenCV + Python也能帮你自动裁剪扫描图像的边缘。有时候手机拍文档歪了、有阴影，脚本能检测边框，矫正透视，输出一张干净整齐的A4尺寸图，直接打印出来也看不出来是随手拍的。

这些操作不需要编程基础也能上手。安装Tesseract-OCR引擎，pip装个依赖，照着示例改两行路径，大多数家用场景都能覆盖。比起买几百块的商业软件，自己搭一套更灵活，还省了订阅费。

下次扫描前，先想想：这事能不能交给Python？往往写二十行代码，就能省下两小时重复劳动。