上周赶部门周报收尾,截了三张纸质报表的实拍图,卡在如何把图片转换成word文档这件事上,当时离下班只剩四十分钟,不敢随便下网上的转换器,怕捆绑垃圾软件。
最先随手点开了浏览器搜的免费在线转换网页。上传两张表格图片后,页面一直转圈,等了快五分钟才跳出结果。转出来的word排版彻底乱掉,表格线条错位,数字串成一整行,而且文档里所有文字都还是图片格式,根本没法复制修改。事后才反应过来,这类在线工具只会把多张图片拼接进word,不是提取文字,完全做不到内容编辑。
删掉在线网页,没再试别的同类网站。之前同事用在线工具转图,电脑被动装了三个弹窗插件,清理花了半小时,这类网页的隐性捆绑一直没人细说,肉眼根本分辨不出来。
只用过一次WPS自带的转换功能。当时直接右键本地图片,菜单里有图片转文档选项,点进去默认开启高清识别。原图是灯光偏暗的室内实拍报表,边缘有轻微阴影,识别后小字出现十多处错别字,比如把“0”识别成“o”,表格单元格内容互相穿插。
就停在这个瑕疵方案里,没有更换工具。懒得再对照教程调图片亮度、裁剪边缘,额外花费的时间,不如直接在word里手动改错别字。
(极短段落)亮度是识别误差的主要诱因。
后来偶然发现电脑自带的OneNote可以兜底,不需要登录会员、不需要联网。把原图直接拖拽进OneNote空白页面,右键图片选择复制图片中的文本,等待两秒系统后台识别完成,粘贴到空白word里,排版基本贴合原图行列顺序,只有个别模糊连笔字识别出错。对比WPS,它不会打乱原生表格结构,也没有任何会员弹窗。
这里有个很不起眼的人为疏漏,之前一直搞错复制步骤。以前直接复制整张图片粘贴到word,误以为就是文字提取,实际只是图片迁移。真正有效的操作是复制识别后的纯文本,两步操作看着相近,结果完全不一样。
那天改完报表保存文档的时候,指尖无意识多点了一次保存。盯着屏幕里规整的表格文字,脑子里只剩一个念头:后悔一开始迷信第三方工具,白白耗掉二十多分钟。
(字数1124)