添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

您可以通过定义和导入一个 Adobe PDF 文件来创建 Analytics 表。

当您使用 数据定义向导 来处理 PDF 文件时,Analytics 可能完全或部分地自动定义该文件,否则您可能需要手动定义该文件。

定义 PDF 文件可能很富有挑战性。如果您遇到问题,请参阅 定义和导入打印图像(报告)文件和 PDF 文件

找到并选择 PDF 文件

  • 选择 文件 > 新建 >
  • 如果出现 选择数据源平台 页,则选择 本地 ,然后单击 下一步
  • 选择本地数据源 页面中,选择 文件 ,然后单击 下一步
  • 选择要定义的文件 对话框中,选择您想要从中创建该 Analytics 表的 PDF 文件,然后单击 打开

    Adobe PDF 文件的后缀为 .pdf

  • 文件格式 页面中,验证已选择 PDF Adobe Acrobat 文件 选项,然后单击 下一步
  • 定义 PDF 文件

  • PDF 文件定义 页面中,如果需要,请输入 PDF 文件的密码并单击 下一步
  • 如果您想要指定特定页面或页面范围以进行分析,而不是指定 所有 页面,请选择 页面 ,然后指定一个或多个页号。

    可指定由逗号分开的单个页面 (1,3,5)、页范围 (2-7) 或者组合 (1, 3, 5-7, 11)。

    提示

    在某些情况中,逐个页面地解析 PDF 文件有助于解决数据不一致问题。

    如果您采用此方法,您需要多次导入该文件,创建一个以上的 Analytics 表,然后在 Analytics 中附加生成的表。

    有关详细信息,请参见 定义和导入打印图像或 PDF 数据的子集

  • 使 PDF 分析器 保持默认设置 Xpdf ,或者选择 VeryPDF

    如果您是首次导入文件,并且您没有任何理由采取其他行动,请将设置保持为 Xpdf

    如果您已经在对文件使用 Xpdf 时遇到数据对齐问题,请选择 VeryPDF 以查看分析结果是否更好。

  • 单击 下一步

    PDF 文件将被分析,并且 PDF 文件定义 页面更新以显示分析后的文件。

  • 纵向和横向滚动鼠标以检查分析后的文件。

    高亮显示指示 Analytics 是否在文件中拥有自动定义的数据:

    高亮显示 含义
    水蓝色高亮显示 自动定义为域的数据。
    灰色高亮显示

    自动定义为记录的数据。

    记录定义依赖于该记录中至少有一个域被定义。

    白色背景

    未定义的数据。

    Analytics 无法检测数据中的模式,并且无法自动定义数据。

  • 可选。如果分析文件中的数据存在错位现象,请单击 上一步 ,在 PDF 分析器 中切换分析器选择,然后单击 下一步

    PDF 文件将被使用您选定的分析器重新分析,这可能生成更好的数据对齐方式。

    当您重新分析该文件时,任何现有的域和记录定义都会被删除。

  • 执行下列操作之一:
    自动定义的结果 要执行的操作
    如果 Analytics 自动定义了该文件并且您不想进行任何更新 如果 Analytics 完美地自动定义了整个文件,并且您 想:
    • 更新通用域名称
    • 向详情数据添加任何页眉数据或页脚数据

    转到 最终完成 PDF 文件定义

    如果 Analytics 自动定义了该文件并且您想要进行更新 如果 Analytics 完美地自动定义了整个文件,并且您想要:

    提示

    您还可以在 数据定义向导 的后续页面中更新通用域名称,您可能会认为这样操作更方便。

    如果自动定义包含错误 如果自动定义:
    • 包含错误
    • 排除您需要的数据
    • 包含您不需要的数据

    您必须执行以下操作之一:

    提示

    如果自动定义包含重大错误,则删除整个自动定义并手动定义文件可能更容易。

    如果经过分析的文件完全未定义 如果经过分析的文件完全未定义(以完全的白色背景表示),则您必须 手动定义 PDF 文件
  • 编辑自动定义

    如果您想要编辑自动定义(或手动定义),请在 PDF 文件定义 页面中,执行下列任一操作:

    编辑域定义 右键单击水蓝色域并选择 编辑域 ,或者双击该域。

    您可以进行一些更改,包括:

    • 更新域名称
    • 更新数据类型
    • 高级选项 下:
      • 更改域长度( 域宽度
      • 更改域的开始位置

    有关更多信息,请参阅 处理记录定义

    编辑记录定义 右键单击一个灰色记录并选择 编辑记录 ,或者双击该记录。

    您可以进行两项主要更改:

    • 更新记录的分类–包括详情、头和尾三个选项
    • 修改 Analytics 用于捕捉记录集的标准

    有关详细信息,请参阅 处理记录定义

    删除域定义或记录定义 右键单击某个域或者记录,然后选择 删除域 或者 删除记录

    您可以删除您不希望包括在 Analytics 表中或者由于其自动定义中包含错误而想要手动定义的域的定义。

    如果您删除记录定义,则该记录包含的任何域定义也被删除,并且此文件中该记录定义的所有实例也被删除。

    说明

    您只是删除域定义或记录定义,而非实际数据。如有必要,您可以重新定义同一个域或记录数据。

    提示

    如果您想要有选择地删除记录,请选择 编辑记录 并优化 Analytics 用于捕捉记录集的标准。

    有关详细信息,请参见 处理记录定义

    手动定义 PDF 文件

    开始之前,您可能会发现首先通过随附的屏幕截图查看一下下面介绍的基本步骤会很有用: 快速入门步骤

    您还可以使用已保存的域和记录定义(如果它们存在)定义 PDF 文件。

    有关详细信息,请参见 使用已保存的域和记录定义集定义 PDF 文件

  • PDF 文件定义 页面中,选择一个数据值以开始定义该表中的一个域。

    例如,您可以在 SSN 域中选择一个社会保险号。当您选择数据值时, 域定义 对话框将会打开。

    准则:

    • 您可以在数据中的任意位置选择一个值。您无需使用该表中的第一个域或者选择域中的第一个值。
    • 您选择的值可以是详细数据、头数据或尾数据。
    • 请勿选择域名称。使源文件中的所有域名称保持未选定状态。如果您选择源文件中的域名称,则 Analytics 会将其视为包含在域中的数据。
    • 如果域值的长度不同,请选择最长值,或者选择额外空格以便为该域中处于较低位置且当前未显示的较长值保留裕量。

    如果您打算使用您选择的初始数据值来唯一地标识一个记录集,请参见 处理记录定义

  • 输入该域的名称,如有必要更新数据类型,然后单击 确定
  • 在您刚刚选择的数据值中,或者在文件的同一行中,选择能够唯一标示源文件中的记录集的字符或字符串。

    例如,选择:

    • 日期值中的反斜杠
    • 数值中的小数点
    • 包含您选择的数据值的行中任意位置的唯一标识值

    当您选择一个或多个独特的字符时, 记录定义 对话框将会打开,并且包含这些字符的所有记录都会高亮显示为灰色。

    有关详细信息,请参见 定义和导入打印图像(报告)文件和 PDF 文件

    如果您需要定义的记录的长度超过源文件中的一个行,请参见 处理多行记录和域

  • 如果需要,请更新 记录类型 以匹配您要定义的数据的类型:详细、头或尾。
  • 如果需要,请修改用于捕捉记录集的准则。

    例如,您可以添加附加的准则以忽略最初捕捉的某些记录。

    有关详细信息,请参见 处理记录定义

  • 单击 确定

    您定义的域被突出显示为水蓝色,并且关联的捕捉记录集被突出显示为灰色。

  • 纵向滚动鼠标以检查已定义的域,以及关联的捕捉记录集。
  • 如果该域未正确定义,或者如果捕捉记录集需要调整,请双击该域或该记录,然后在 域定义 对话框或 记录定义 对话框中进行必要的编辑。

    有关详细信息,请参见 处理记录定义 处理记录定义

  • 通过为每个域选择一个代表性的数据值,定义该记录中的其余域。

    附加域会自动符合该记录集。

    准则:

    • 只在结果 Analytics 表中定义您需要的那些域。
    • 对于每个域定义,纵向滚动鼠标以检查定义域。根据需要编辑定义。

      例如,如果数据值未完全包含在域中,您需要调整该域的长度和/或开始位置。

      有关详细信息,请参见 编辑自动定义

    • 如果您需要定义的域值超过源文件中的一个行,请参阅 处理多行记录和域
    提示

    定义详细信息域的顺序,就是其出现在结果 Analytics 表中的顺序。

    如果您在定义过程中删除了一个详细域,然后重新添加了它,则它会失去其原始位置,并且被放置在所有详细域的末尾。

  • 如果您想要定义另一记录,请重复执行步骤 1 到 9。

    准则:

    • 当您选择一个数据值以开始定义一个新域和关联的记录集时,请确保在出现的对话框中选择 新建记录 ,然后单击 确定
    • 您可以定义多个头记录或尾记录,但只能定义一个详细记录。您定义不同记录类型的顺序不是强制的。
  • 使用已保存的域和记录定义集定义 PDF 文件

    您可以使用以前的文件定义会话中已经保存在 打印图像查询文件 中的域和记录定义来定义 PDF 文件。该打印图像查询文件必须已存在,并且已保存的定义必须匹配当前数据。

    加载打印图像查询文件会删除任何当前域和记录定义。

  • PDF 文件定义 页面中,单击 加载
  • 导航到以前保存的打印图像查询文件,选择它,然后单击 打开

    相应的定义被应用于当前数据。

    打印图像查询文件具有 .txt 扩展名。

    说明

    请只加载包含您知道匹配或接近于匹配当前数据的定义的文件。

  • 加载该文件后,请执行以下操作之一:
  • 最终完成 PDF 文件定义

  • 可选。如果您想要将当前的域和记录定义集保存到打印图像查询文件,请执行以下操作:
    1. 单击 保存
    2. 输入打印图像查询文件的名称,然后单击 保存

    说明

    域和记录定义通常意味着大量工作,因此建议您保存它们。

    如果您随后发现所导入的数据需要调整,并且必须重新定义和重新导入,则无需从头重新创建已保存的定义。

  • 当您对所有域和记录定义感到满意时,请单击 下一步

    说明

    如果需要,您可以返回到流程中的这个步骤,并更新域和记录定义。

  • 保存 Analytics 数据文件

    数据文件另存为 对话框中,为该 Analytics 数据文件输入一个名称,然后单击 保存

    如果 Analytics 预填充数据文件名,您可以接受预填充的名称,也可以更改它。

    如果您不想使用由 Analytics 打开的默认位置,您还可以导航到不同的文件夹以保存数据文件。

    编辑 Analytics 域属性

    编辑域属性 页面中,检查由 Analytics 分配给下面列出的属性的设置,进行任何必要的更新,然后单击 下一步

    在预览表中选择一个列标题,以查看与该列相关联的属性。

    被分配给 Analytics 中的域的数据类型。

    您可以保留由 Analytics 分配的数据类型,或者从下拉列表中选择适当的数据类型。

    有关 Analytics 中支持的数据类型的信息,请参见 Analytics 中的数据类型

    一个只读属性,它显示域中的第一个值。

    该值会基于您所做的任何编辑动态更新。

    仅限于数值域。源数据中的小数位数。

    说明

    当您选择“数值”数据类型时, 小数位 文本框会自动出现。

    仅限日期时间域。源数据中的日期时间值的格式。

    您指定的格式必须与源数据中的格式精确匹配。

    要了解日期和时间格式相关的更多信息,请参考 日期和时间源数据格式

  • 最终 页中,验证新 Analytics 表的设置,然后单击 完成

    如果您想要进行任何更改,请单击 上一步 到达该向导中的适当页面。

  • 为您要添加到项目的表布局输入一个名称,或者保留默认名称,然后单击 确定

    将使用所导入的文件中的数据创建一个新的 Analytics 表。

    说明

    Analytics 表名称限制为 64 个字母数字字符,且不包括 .FIL 扩展名。该名称可以包括下划线字符 ( _ ),但不能包括其他特殊字符或任何空格。该名称不能以数字开头。

  •