科技生活指南
柔彩主题三 · 更轻盈的阅读体验

用Python脚本搞定扫描图像识别,办公效率翻倍

发布时间:2026-01-22 01:20:44 阅读:195 次

每天对着一堆纸质文件发愁?发票、合同、手写笔记堆成山,光是录入就耗掉大半天。其实你手里的扫描仪不只是个复印工具,配上几行Python脚本,它立马变身智能文档助手。

从扫描到识别,一步到位

很多人不知道,Python有个叫Pytesseract的库,能直接读取扫描图片里的文字。比如你把一份报销单扫成PDF或JPG,脚本可以自动提取金额、日期和商户名称,再填进Excel里。不用手动敲一个字。

import pytesseract
from PIL import Image

# 打开扫描后的图片
img = Image.open('receipt_001.jpg')

# 识别文字
text = pytesseract.image_to_string(img, lang='chi_sim+eng')

print(text)

这段代码跑完,图片里的中英文内容就变成可编辑的文本了。加个循环,一次处理几十张扫描件也不在话下。

实际场景:家庭账本数字化

我妈每个月都攒着一堆超市小票,想记账又懒得翻。我写了个小脚本,她只要把手机拍的票据照片扔进指定文件夹,程序自动识别金额和时间,生成月度支出统计表。现在她自己都会定期“投喂”照片了。

还能干点别的

除了识字,OpenCV + Python也能帮你自动裁剪扫描图像的边缘。有时候手机拍文档歪了、有阴影,脚本能检测边框,矫正透视,输出一张干净整齐的A4尺寸图,直接打印出来也看不出来是随手拍的。

这些操作不需要编程基础也能上手。安装Tesseract-OCR引擎,pip装个依赖,照着示例改两行路径,大多数家用场景都能覆盖。比起买几百块的商业软件,自己搭一套更灵活,还省了订阅费。

下次扫描前,先想想:这事能不能交给Python?往往写二十行代码,就能省下两小时重复劳动。