[テキスト認識]表示枠([オプション]ダイアログ・ボックス>[GUI テスト]タブ)

関連:GUI テストおよびコンポーネント

この表示枠では、UFT One がアプリケーション内のテキストを認識する方法を設定します。この表示枠では、標準のテキスト・キャプチャ・メカニズム、OCR(光学式文字認識)メカニズム・モード、および OCR メカニズムでテキストを認識するのに使用する言語辞書を変更できます。

アクセス方法

[ツール]>[オプション]>[GUI テスト]タブ>[テキスト認識]ノードを選択します。

重要な情報

出荷時の標準設定に戻す]ボタンを選択すると、[オプション]ダイアログ・ボックスのすべてのオプションが標準設定にリセットされます。

この表示枠の設定は、「実行時のテキスト認識」の説明のように、OCR(光学式文字認識)でテキストを識別するときに使用されます。

関連タスク

参照

次に、オプションについて説明します。オプションは、選択したテキスト認識エンジンによって異なります。

使用する OCR エンジンを決定する際は、「使用する OCR エンジンを決定します」を参照してください。

UI 要素 説明
Abbyy OCR テキスト認識エンジン(標準設定)
テキスト認識モード

アプリケーション内のテキストを認識する方法:

  • 単一テキスト・ブロック・モード:単一テキスト・ブロック・モードでは、当該領域に焦点を合わせ、単一テキスト・ブロックとして扱うよう OCR メカニズムに指示します。このモードは、小さなオブジェクト上または小さなテキスト領域でテキストをキャプチャする場合に役立ちます。オブジェクトのテキストがフォント、サイズ、色、および背景に関して統一されている場合は、このボタンを選択します。

  • 複数テキスト・ブロック・モード:複数テキスト・ブロック・モードでは、オブジェクト内で背景、フォント、およびサイズが異なる各テキスト領域を処理するよう OCR メカニズムに指示します。OCR メカニズムにより、内部アルゴリズムに従ってテキスト・ブロックをどこで分割するかが決定されます。このラジオ・ボタンを選択するのは、オブジェクト上のテキストがさまざまなフォント、フォント・サイズ、色、および/または背景で構成されている場合だけです。

利用可能な言語

オブジェクトからテキストを取得するときに、OCR メカニズムで使用される可能性のある言語辞書がすべて表示されます。

OCR メカニズムで使用する言語辞書を指定するには、次の手順を実行します。言語を選択し、右矢印ボタン()をクリックして、言語を[サポートされる言語]リスト・ボックスに移動します。

サポートされる言語

テキストをキャプチャするときに OCR メカニズムで使用される言語辞書が表示されます。

利用可能な言語]リストから[サポートされる言語]リストに言語を追加して、テキスト認識に使用する言語を指定します。

UFT One 15.0.1 以降:サポートする複数の言語を選択できます。

UFT One 15.0 以前:サポートされる言語]リスト・ボックスには、次のいずれかを表示できます。

  • 1 つの CJK 言語(中国語、日本語、韓国語)

    CJK 言語内でのテキスト・キャプチャでは、英語も標準でサポートされています)。

  • 1 つ以上の非 CJK 言語。
テキスト認識を使用する前に画像を前処理 指定されたオブジェクトまたは領域内のテキストを識別する前に、テキスト認識で画像要素を識別できるようにします。
Baidu または Google OCR テキスト認識エンジン
言語タイプ

(Baidu のみ)

テキスト認識をサポートする単一の言語、または中国語と英語の組み合わせ。

アクセストークン]または[キー Baidu または Google Cloud アカウントへのアクセスに使用するアクセス・トークンまたはキー。
プロキシ設定

インターネット接続でプロキシが必要な場合は、プロキシ・サーバのアドレスと認証の詳細を指定します。

プロキシ・タイプUFT Mobile サーバへの接続に使用するプロキシのタイプを定義します。

  • システム・プロキシ

  • HTTP プロキシ

プロキシ・アドレス:プロキシ IP アドレスとポートです。[システム プロキシ]が選択されている場合、このフィールドは自動的に入力され、読み取り専用です。

認証の指定:特定のアカウントを使用して UFT Mobile サーバに接続できるようにします。

プロキシ・ユーザ名とパスワード:認証の指定]が選択されている場合に、UFT Mobileサーバへの接続に使用される資格情報です。

UFT One 15.0.1:プロキシ設定の選択を解除すると、標準のプロキシ設定が使用されます。

UFT One 15.0.2 以降:プロキシ設定の選択を解除すると、この接続にプロキシは使用されません。

注意: モバイル・アプリケーションに UFT OCR を使用している場合は、UFT Mobile サーバに接続するためのプロキシ設定([オプション]>[GUI テスト]>[モバイル]>[プロキシ設定])が OCR のプロキシ設定([オプション]>[GUI テスト]>[テキスト認識]>[プロキシ設定])と同じであることを確認してください。

接続テスト

接続テスト]を押して接続の詳細をテストし、UFT One がクラウド OCR サービスに接続できることを確認します。

Tesseract OCR テキスト認識エンジン
テキスト認識モード

アプリケーション内のテキストを認識する方法:

  • 単一テキスト・ブロック・モード:単一テキスト・ブロック・モードでは、当該領域に焦点を合わせ、単一テキスト・ブロックとして扱うよう OCR メカニズムに指示します。このモードは、小さなオブジェクト上または小さなテキスト領域でテキストをキャプチャする場合に役立ちます。オブジェクトのテキストがフォント、サイズ、色、および背景に関して統一されている場合は、このボタンを選択します。

  • 複数テキスト・ブロック・モード:複数テキスト・ブロック・モードでは、オブジェクト内で背景、フォント、およびサイズが異なる各テキスト領域を処理するよう OCR メカニズムに指示します。OCR メカニズムにより、内部アルゴリズムに従ってテキスト・ブロックをどこで分割するかが決定されます。このラジオ・ボタンを選択するのは、オブジェクト上のテキストがさまざまなフォント、フォント・サイズ、色、および/または背景で構成されている場合だけです。

テキスト認識用の記号

テキスト認識を特定の文字に制限できます。

このオプションは英語でのみサポートされます。

現在の言語パック

テキスト認識で使用する現在の言語。一度に使用できる言語パックは 1 つだけです。

新しい言語パックをダウンロードしてインストールするには、Tesseract OCR 言語パックのダウンロードサイト(https://sourceforge.net/projects/tesseract-ocr-alt/files/?source=navbar)にアクセスするか、表示枠のリンクをクリックします。

言語パックをダウンロードしたら、<UFT One インストール・フォルダ>/dat/tessdata にある OCR エンジン・フォルダにファイルを追加できます。

高速モード テストの実行速度を向上させるために(テキスト認識の精度を犠牲にして)パフォーマンスを最大化するように UFT One に指示します。
標準設定の Tesseract 設定の使用 言語データ・ファイルに記載されている標準の Tesseract 設定を使用するように UFT One に指示します。
ファイルの設定の使用

外部で定義されたファイルから設定をロードできます。

設定オプションの中には、UFT One では使用できないものもあります。[出力]表示枠には、以下のようにテストの実行時に無視されるパラメータのリストが表示されます(例:interactive_display_mode パラメータ)。

  • %parameter_name% パラメータはサポートされていません。

  • Tesseract OCR エンジンがエラーのため停止しました。Tesseract の設定を確認して、再試行してください。

  • % parameter_name% パラメータの値のタイプが正しくありません。このパラメータはテスト実行中に無視されました。

  • %parameter_name% パラメータは Tesseract OCR エンジンではサポートされていません。

独自の設定ファイルを作成する方法の詳細については、http://www.sk-spell.sk.cx/tesseract-ocr-parameters-in-302-version を参照してください。

テキスト認識を使用する前に画像を前処理

指定されたオブジェクトまたは領域内のテキストを識別する前に、テキスト認識で画像要素を識別できるようにします。

このオプションを使用すると、UFT One は画像を白黒画像に変換し、サイズを変更します。ただし、これにより、テキスト認識を実行する際の UFT One のパフォーマンスが低下します。そのため、このオプションを使用してテキスト認識を実行する場合は、テストの実行にさらに時間がかかることが予想されます。

このオプションは、アプリケーションで使用されるフォント・サイズが非常に小さい(10 ポイント以下)場合に使用することをお勧めします。