当前位置:XML > XML功能

如何从Word中找出水印

北京皮炎权威医院 http://liangssw.com/bozhu/11449.html

正文共:字18图预计阅读时间:5分钟

之前曾收到粉丝提交的一个案例,在一份教案中存在水印文字。

经过群友尝试,发现其中的水印部分,既不是Word自带的水印,又不是背景图片,也不是文本框,看起来似乎无解。

本节课就对此类问题给出通解思路,便于大家学习交流。

分析问题

所谓的水印,就是一类用来起到标注版权作用的图标、文字、音频等。

像上文中的底图里能看到斜着的新课标字样,就属于水印。

自带水印功能

通常情况下,Word中的水印由自带的设计选项卡下的水印功能提供,此类水印可以通过删除水印功能来快速去除。

插入文本框

此外,也可以通过插入选项卡下的文本框功能来实现,这种方法更自由,不过页面数量大的时候相对于水印功能会比较麻烦。

这种水印是可以被搜索功能正常识别的,如下图:

插入图片

要想不被搜索,换个思路,插入图片也是可以的。

但需要注意的是,插入图片和插入文本框两种方法,需要将环绕文字方式修改为衬于文字下方,如此一来操作略微麻烦。

但经过测试,本次案例所用的手法,并不是上述三种常见水印,因此在这里将介绍本人遇到此类问题时的通用解决方案。

解决之道

在之前的技术小灶直播中,我们多次提到了Word的格式问题,从早期的.doc文件到现在的.docx文件,在提高安全性(默认禁用宏)的同时也提高了规范性(不同类别的数据存储于不同的xml文件中),让解析文件变的更容易。而升级后的.docx文件在本质上是一个压缩文件,本次我们就利用这个思路来解决问题。

如果你没听过,那你肯定逃课了。

提取关键信息

既然要利用.docx文件的特性,那肯定先得把.doc文件转存为.docx,这样才能方便下一步操作。

转换方法很简单,文件,另存为,格式选.docx,保存即可。

下一步,按F2重命名,把后缀从.docx改成.zip。

右键,解压文件,得到下图所示的目录结构,原Word文件中的所有数据,就都包含在这些文件里了。

数据分析

肉眼能识别来的水印,无非就是图片或者文字两种表现形式,既然我们已经有了所有的数据,接下来只需要判别这个水印到底是文字还是水印即可。

图片水印

Word中的图片资源,集中保存在word目录下的media文件夹里,进去就能找到刚才我们设计的图片水印。

能在这里找到水印对应的图片,就说明在文档中水印是以图片形式存储的,那么可以通过定位等操作来完成找水印目的。

不过这个.wmf格式稍微有点儿不同,在Office中,它属于图元文件,因此如果用定位图片的方法操作,无法被顺利找到。

当然,这是我故意做进来的一个特例,一般情况下水印都是正常的.jpg或者.png或者.gif文件,能够被图形定位。

值得一提的是,这个图元文件是通过我开发的EasyWord插件的一键转图功能实现的,最初的目的是为了过掉论文检测,所以具有这个特性。

在文档中找到水印,此时会遇到一个小问题:因为水印是衬于文字下方的,导致选择起来略微困难。

这里有两个选择技巧,一是找没有文字只有水印的地方,比如下图所示的位置,这时点击通常就能选到底图了。

另一个技巧是,你可以通过打开布局选项卡里的选择窗格来选取图片,个人建议掌握这一种方法。

文字水印

说完了图片水印,再来说说文字水印。

文字水印相对比较麻烦,需要重点排查以下几个文件:

首先是word目录下的document.xml文件,这个文件存放了word中的正文内容。

用一个代码编辑工具,如vscode打开它,直接搜索水印的内容。

搜到了一个,但不是水印的内容,说明水印不在正文中。

接下来去header里搜,一个文档中可能存在多个header,它代表的是文档的页眉。

同样的,也需要去footer里找,它代表的是页脚。

运气比较好,在header2里就找到了我们的目标。

现在思考,在header里找到了这段文字,说明了什么?

上面也到,header代表的是页眉,页眉中找到了这段文字???

赶紧去原文档的页眉里看看。

双击页眉,看起来是比较正常的,把页眉顶端距离改大一点儿看看。

成功找到了水印。

总结

其实在打开选择窗格的时候,有经验的人就能找到这个水印所处的位置了,因为艺术字的小眼睛是灰色无法被操作的状态,很明显说明艺术字存在于页眉页脚等不可操作区域。

这次案例的水印思路相对较隐蔽,利用了编辑正文时页眉不可编辑、不可搜索、不可定位、同时存在于多个页面的特性,制作了这个水印。具体的操作方法是先设置一个相对较大的页眉高度,插入水印后将高度改回去,是一个很值得借鉴的思路。

课件下载




转载请注明:http://www.vviuov.com/lcbx/1063075.html

  • 上一篇文章:
  • 下一篇文章: 没有了