<output id="zcubm"></output>
<tt id="zcubm"><button id="zcubm"></button></tt>
      <meter id="zcubm"><delect id="zcubm"><source id="zcubm"></source></delect></meter>
      <listing id="zcubm"></listing>

      1. 你好,游客 登录 注册 搜索

        背景:
        阅读内容

        三步法“攫取”文本信息

        [日期:2018-03-08] 来源:  作者:山东 杨鑫芳 [字体: ]

         

          文本信息的获取可以说是收集各种多媒体信息操作中最为容易的~种,在很多情况下都是通过直接拖动选中后复制、粘贴即可实现。但是,当我们遇到那些做了防下载处理的网页时(不响应鼠标的拖动操作),或是防二次编辑的PDF文档,甚至是有些网页一拖动选中就会出现各种随机干扰码……此时,推荐大家试一下三步法“攫取”文本信息,只须使用电脑上所安装的常规软件即可轻松实现。
          
          【第一步】用QQ进行屏幕截图以某PDF文档为例,在已经运行了腾讯QQ的前提下,首先直接按CTRl-Alt-A组合键在打开的PDF文档页面中进行鼠标拖动来屏幕截图——使用组合键的好处是不必打开任?#25105;?#20010;聊天窗口且操作十分快捷;调节好待截取的屏幕区域后,再点击右下角的“完成”按钮,这样就将?#20204;?#22495;图像内容进行了复制操作。
          
          【第二步】用OneNote的“复制图片中的文本”进行文本识别运行OfiICe组件中的OneN6ce,直接按Ctrl-V组合键进行粘贴操作,界面中就会出现上一步使用QQ屏幕截图功能复制出来的PDF文档图片内容;接着,在该图片?#31995;?#20987;鼠标右键选择“复制图片中的文本”项,此时并未有任何操作提示但已经初步“攫取”出了文本信息。
          
          【第三步】用Word“替换为”整理格式新建一个Word文档,仍然是按Ctrl-V组合键进行粘贴操作,之前在PDF中所看到的文本信息立刻就会出现(OneNote的文本识别率是相当高的),但还有两个小问题需要解决:~是相邻文?#26088;?#37117;有个半角空格,二是?#36127;?#27599;一行信息最后都有垂直向下的软回车箭头和?#19981;?#36710;,这?#23478;?#36890;过Word“替换为”功能来整理。
          
          1.处理半角空格首先,选中?#25105;?#20004;个文?#26088;?#30340;空格并按Ctrl-C组合键复制;然后,再按Ctrl-H组合键弹出“查找和替换”一“替换”对话框:在“查找内容”处按Ctrl-V组合键将刚刚复制的半角空格进行粘贴,下方的“替换为”处保持不变;最后,点击“全部替换”按钮,Word就会提示“全?#23458;?#25104;。完成331处替换。”,点击“确定”按钮将它关闭,我们就得到了一行行整齐排列但行末?#28304;?#26377;软回车的文本信息。
          
          2.处理软回车和?#19981;?#36710;仍是按Ctrl-H组合键弹出“查找和替换”一“替换”对话框,此?#26412;?#19981;能使用先复制再粘贴半角空格的方法来处理软回车了,而是应该在“查找内容”处输入“^1”(保证是英文输入状态),第一个符号是Shift+数字6,第二个是小写字母1;再点击“全部替换”按钮,Word就会提示“全?#23458;?#25104;。完成13处替换。”,点击“确定”按钮将它关闭;接着?#36127;?#26159;重复这样的操作,只不过将“^l”更换为“^p”(小写字母p),?#19981;?#36710;也可快速被清除掉。
          
          经过以上三步攫取文本信息的操作,我们基本上就得到了还算干净的文本信息,最后只须对照原信息进行一些简单的修改和调节操作即可,大家不妨一试。

             往下看有更多相关资料

        推荐文章 收藏 推荐 打印 | 整理:嘉嘉宝宝 | 阅读:
        查看相关资料      
        专题文章
        热门评论

        天津快乐十分一定牛
        <output id="zcubm"></output>
        <tt id="zcubm"><button id="zcubm"></button></tt>
            <meter id="zcubm"><delect id="zcubm"><source id="zcubm"></source></delect></meter>
            <listing id="zcubm"></listing>

            1. <output id="zcubm"></output>
              <tt id="zcubm"><button id="zcubm"></button></tt>
                  <meter id="zcubm"><delect id="zcubm"><source id="zcubm"></source></delect></meter>
                  <listing id="zcubm"></listing>