词条 | TextPorter |
释义 | 软件功能特色(支持对多种格式文档的自动识别 支持多语言显示和编辑 可指定抽出文本内容的大小 指定是否抽出文件中的OLE内容 可指定Excel和AutoCAD文档数据间分割符种类 可指定输出和标记 对PDF文件的支持) 软件简介TextPorter是集"文本抽出、全文检索、文字编码转换、快速浏览"于一身的应用程序软件, 它采用了16位UNICODE字符集作为其编辑器的内码,再加上通用文本抽出库(DMC)对多语言 的良好的支持能力,使得不用安装其他应用程序,在一个程序中实现对多种常用应用程序的 不同语言版本的文件的文本内容进行操作成为可能。即使在不同语言的操作系统环境、或者 用户指定不同的显示字符集,UNICODE编码都能成功的保证数据的准确性。在 Windows 9X和 Windows NT/2K/XP系统共存今天,面对各种纷繁复杂的电子文档,TextPorter可以提供一种简便、 高效和实用的文档处理方法。 软件功能特色支持对多种格式文档的自动识别不用安装任何相关应用程序,TextPorter能够对包括MS Office系列、MS Works、 RTF、PDF、PageMaker、TXT等十多种文件的自动识别,对MS Office系列文件还能 够识别出文件的语言类型;特别是对于格式文件中的OLE对象,TextPorter能够进 行自动识别;对于TXT文件,可以判断出文件的字符集形式。 支持多语言显示和编辑TextPorter提供了一个多语言编辑器,对文本内容可以根据预定的语言类型进行 显示、查找、替换及文件保存。目前支持包含简体中文、繁体中文、日文、韩文 和英文在内的13种字符集。同时编辑器还支持多种语言的输入法,可以自动识别 各输入法的国别信息。 目前支持的字符集有: * 中文字符集合:ChineseGBK(包含GB2312),ChineseBIG5 * 日文字符集合:Windows-31J、Shift_JIS、EUC-JP、EUC-JP-FIX、ISO-2022-JP * 朝鲜语字符集合:KoreanKSC * 英文字符集合:ISO8859-1 * 国际字符集合:UTF-8、UTF-16、ISO-10646-UCS-2、ISO-10646-UCS-4 可指定抽出文本内容的大小对于存在较大文件的情况下,使用该选项可大大增加文件的抽出速度和浏览速度,方便查找所需内容。 指定是否抽出文件中的OLE内容文件中的OLE对象的内容是文件的重要的组成部分,有了该选项,即保证了文件内容抽出的灵活性,也保证了文件内容的完整性。 可指定Excel和AutoCAD文档数据间分割符种类对于Excel和AutoCAD文档,抽出时指定数据间的分割符号,可以极大的提供该类文本数据文件的可管理性,同时也方便了用户对文件内容的浏览、管理和检索。 可指定输出和标记对于PowerPoint的幻灯片文档,抽出时指定输出和标记,在抽出文本内容时候,应用程序自动会把每个显示页上的文本内容括在标记内,而把备注中文本内容括在标记内。用户在浏览时就可以非常清楚的分辨出幻灯片和备注的内容,同时也大大增强了文本数据本身的可管理性。 对PDF文件的支持PDF文件作为国际通用电子文档格式,它的电子文档一直都广泛应用于各个行业和领域中, 特别是它安全特性,一直都受到良好的评价,近几年随着Internet的发展和普及,PDF的应 用将更加深入。DMC库对PDF文件也提供了良好的支持,它不仅支持通常的多种语言的PDF文 件的文本抽出,而且还支持具有“安全性口令”保护的PDF文件的文本抽出,同时又提供了 对具有“打开口令”保护的PDF文件的支持方法,只要在“口令对话框”中输入正确的文件 口令,就可以浏览到指定文件的文本内容了。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。