文本识别窗格 (选项对话框 > GUI 测试选项卡)

相关项: GUI 测试和组件

该窗格允许您配置 UFT One 如何识别应用程序中的文本。可以使用该窗格修改默认文本捕获机制、OCR (光学字符识别) 机制模式和 OCR 机制用于识别文本的语言字典。

访问

选择工具 > 选项 > GUI 测试选项卡 > 文本识别节点。

重要信息

“恢复出厂默认设置”按钮会将“选项”对话框中的所有选项都重置为其默认设置。

使用 OCR (光学字符识别) 标识文本时,将使用此窗格中的设置,如运行时中的文本识别中所述。

相关任务

另请参见

选项说明如下。这些选项因您选择的文本识别引擎而异。

在决定使用哪个 OCR 引擎时,请参阅确定要使用的 OCR 引擎

UI 元素 描述
Abbyy OCR 文本识别引擎 (默认)
文本识别模式

在应用程序中识别文本的方式:

  • 单文本块模式: 单个文本块模式指示 OCR 机制聚焦于区域中,并将其视为单个文本块。该选项对尝试捕获小对象上的文本或小文本区域中的文本尤其有用。如果对象文本的字体、大小、颜色和背景都一致,请选择该单选按钮。例如:

  • 多文本块模式: 多个文本块模式指示 OCR 机制处理对象中背景字体和字体大小不同的每个文本区域。OCR 机制按照内部算法决定划分文本块的位置。只有当对象上的文本由不同字体、字体大小、颜色和/或背景组成时,才选择该单选按钮。例如:

可用语言

列出 OCR 机制从对象中检索文本时潜在地可以使用的所有语言字典。

要指定 OCR 机制使用的语言字典: 请选择语言并单击向右箭头按钮 (>) 以将语言移动到支持的语言列表框。

支持的语言

列出 OCR 机制捕获文本时使用的语言字典。

“可用语言”中的语言添加到“支持的语言”中以指定用于文本识别的语言。

UFT One 15.0.1 或更高版本: 您可以选择要支持的多种语言。

UFT One 15.0 或更早版本: “支持的语言”列表框可以包含以下任意一种语言:

  • 一种 CJK (中文、日语、韩语) 语言。

    用 CJK 语言捕获文本时,默认情况下还支持英语。)

  • 一种或多种非 CJK 语言。
在使用文本识别之前预处理图像 使文本识别能够在标识指定对象或区域中的文本之前标识图像元素。
Baidu 或 Google OCR 文本识别引擎
语言类型

(仅限 Baidu)

支持文本识别的单一语言,或“中文与英语”组合。

访问令牌密钥 用于访问 Baidu 或 Google 云帐户的访问令牌或密钥。
代理服务器设置

如果您的 Internet 连接需要代理服务器,请指定代理服务器地址和身份验证详细信息。

代理服务器类型。定义连接到 UFT Mobile 服务器时要使用的代理服务器类型:

  • 系统代理服务器

  • HTTP 代理服务器

代理服务器地址。代理服务器的 IP 地址和端口。如果选择“系统代理服务器”,此字段将自动填充,并且为只读。

指定身份验证。使您可以使用特定帐户连接到 UFT Mobile 服务器。

代理服务器用户名和密码。在选择了“指定身份验证”的情况下用于连接到 UFT Mobile 服务器的凭据

UFT One 15.0.1: 取消选择代理服务器设置后,将使用默认的代理服务器设置。

UFT One 15.0.2 及更高版本: 取消选择代理服务器设置后,对于该连接没有可用的代理服务器。

注释: 如果将 UFT OCR 用于移动应用程序,请确保用于连接到 UFT Mobile 服务器的代理服务器设置 (“选项”->“GUI 测试”->“移动”->“代理服务器设置”) 与 OCR 代理服务器设置 (“选项”->“GUI 测试”->“文本识别”->“代理服务器设置”) 相同。

测试连接

按“测试连接”以测试连接详细信息,并确保 UFT One 可以连接到云 OCR 服务。

Tesseract OCR 文本识别引擎
文本识别模式

在应用程序中识别文本的方式:

  • 单文本块模式: 单个文本块模式指示 OCR 机制聚焦于区域中,并将其视为单个文本块。该选项对尝试捕获小对象上的文本或小文本区域中的文本尤其有用。如果对象文本的字体、大小、颜色和背景都一致,请选择该单选按钮。例如:

  • 多文本块模式: 多个文本块模式指示 OCR 机制处理对象中背景字体和字体大小不同的每个文本区域。OCR 机制按照内部算法决定划分文本块的位置。只有当对象上的文本由不同字体、字体大小、颜色和/或背景组成时,才选择该单选按钮。例如:

文本识别的符号

使您可以将文本识别限制为特定字符。

只有英语支持此选项。

当前语言包

文本识别中使用的当前语言。一次只能使用一种语言。

要下载并安装新的语言包,您可以访问 Tesseract OCR 语言包下载站点 https://sourceforge.net/projects/tesseract-ocr-alt/files/?source=navbar 或者单击窗格中的链接。

下载语言包后,可以将文件添加到 OCR 引擎文件夹中,该文件夹位于“<UFT One安装文件夹>/dat/tessdata”中。

快速模式 指示 UFT One 最大化性能 (以牺牲文本识别准确性为代价) 以提高测试运行速度。
使用默认 Tesseract 配置 指示 UFT One 使用语言数据文件中所述的标准 Tesseract 配置
使用文件中的配置

使您可以从那些在外部定义的文件中加载配置设置。

并非所有配置选项都支持在 UFT One 中使用。“输出”窗格显示在运行测试时忽略的参数 (例如,interactive_display_mode 参数) 的列表:

  • 不支持 % parameter_name% 参数

  • Tesseract OCR 引擎由于错误而停止。检查您的 Tesseract 配置,然后重试。

  • % parameter_name% 参数的值类型不正确。在测试运行期间,该参数被忽略

  • Tesseract OCR 引擎不支持 %parameter_name% 参数

有关如何创建自己的配置文件的详细信息,请参阅 http://www.sk-spell.sk.cx/tesseract-ocr-parameters-in-302-version

在使用文本识别之前预处理图像

使文本识别能够在标识指定对象或区域中的文本之前标识图像元素。

使用此选项时,UFT One 将图像转换为黑白图像并调整其大小。但是,这会在执行文本识别时降低 UFT One 的性能。因此,使用此选项执行文本识别时,预计会在测试运行中花费更多时间。

当您的应用程序使用非常小的字体大小 (10 磅和更小) 时,应使用此选项。