[テキスト認識]表示枠([オプション]ダイアログ・ボックス>[GUI テスト]タブ)

関連:GUI テストおよびコンポーネント

この表示枠では、OpenText Functional Testing がアプリケーション内のテキストを認識する方法を設定します。この表示枠では、標準のテキスト・キャプチャ・メカニズム、OCR(光学式文字認識)メカニズム・モード、および OCR メカニズムでテキストを認識するのに使用する言語辞書を変更できます。

アクセス方法

[ツール]>[オプション]>[GUI テスト]タブ>[テキスト認識]ノードを選択します。

重要な情報

  • 出荷時の標準設定に戻す]ボタンをクリックすると、ALM の接続情報、最近使用したファイルのリスト、および[オプション]ダイアログ・ボックスで定義されたすべての設定(起動オプション、UI レイアウト、GUI、API、BPT テスト・オプション、リモート接続資格情報など)を含むすべての製品設定がリセットされます。

  • この表示枠の設定は、実行時のテキスト認識の説明のように、OCR でテキストを識別するときに使用されます。

  • ABBYY OCR エンジンをテキスト認識に使用するには、OpenText Functional Testing をインストールするときにこのエンジンを含める必要があります。ABBYY がインストールされていない場合は、代わりに Tesseract が標準設定のエンジンとして使用されます。

関連タスク

参照

次に、オプションについて説明します。オプションは、選択したテキスト認識エンジンによって異なります。

使用する OCR エンジンを決定する際は、使用する OCR エンジンを決定しますを参照してください。

ABBYY OCR テキスト認識エンジン(標準設定)

UI 要素 説明
テキスト認識モード

アプリケーション内のテキストを認識する方法:

  • 単一テキスト・ブロック・モード:単一テキスト・ブロック・モードでは、当該領域に焦点を合わせ、単一テキスト・ブロックとして扱うよう OCR メカニズムに指示します。このモードは、小さなオブジェクト上または小さなテキスト領域でテキストをキャプチャする場合に役立ちます。オブジェクトのテキストがフォント、サイズ、色、および背景に関して統一されている場合は、このボタンを選択します。

  • 複数テキスト・ブロック・モード:複数テキスト・ブロック・モードでは、オブジェクト内で背景、フォント、およびサイズが異なる各テキスト領域を処理するよう OCR メカニズムに指示します。OCR メカニズムにより、内部アルゴリズムに従ってテキスト・ブロックをどこで分割するかが決定されます。このラジオ・ボタンを選択するのは、オブジェクト上のテキストがさまざまなフォント、フォント・サイズ、色、および/または背景で構成されている場合だけです。

利用可能な言語

オブジェクトからテキストを取得するときに、OCR メカニズムで使用される可能性のある言語辞書がすべて表示されます。

OCR メカニズムで使用する言語辞書を指定するには、次の手順を実行します。言語を選択し、右矢印ボタン()をクリックして、言語を[サポートされる言語]リスト・ボックスに移動します。

サポートされる言語

テキストをキャプチャするときに OCR メカニズムで使用される言語辞書が表示されます。

利用可能な言語]リストから[サポートされる言語]リストに言語を追加して、テキスト認識に使用する 1 つまたは複数の言語を指定します。

プレビュー

テキスト認識の結果をプレビューします。

OCR 設定の設定値のセットを選択またはカスタマイズし、アプリケーションの画像をアップロードし、対応する結果をプレビューしてから、必要に応じて設定を調整します。

詳細については、[プレビュー]表示枠([オプション]ダイアログ・ボックス>[GUI テスト]タブ>[テキスト認識])を参照してください。

パターン・トレーニング

トレーニング済みパターンを使用する]をクリックすると、ABBYY OCR エンジンがアプリケーション内の通常とは異なる文字や不明瞭な文字を識別できるようになります。

トレーニング済みパターンの作成や、使用する既存のパターンの指定、既存のパターンの変更を行うことができます。

詳細については、ABBYY OCR パターン・トレーニングを参照してください。

テキスト認識を使用する前に画像を前処理 指定されたオブジェクトまたは領域内のテキストを識別する前に、テキスト認識で画像要素を識別できるようにします。

Baidu または Google OCR テキスト認識エンジン

UI 要素 説明
言語タイプ

(Baidu のみ)

テキスト認識をサポートする単一の言語、または中国語と英語の組み合わせ。

アクセストークン]または[キー Baidu または Google Cloud アカウントへのアクセスに使用するアクセス・トークンまたはキー。
プロキシ設定

インターネット接続でプロキシが必要な場合は、プロキシ・サーバのアドレスと認証の詳細を指定します。

プロキシ・タイプDigital Lab サーバへの接続に使用するプロキシのタイプを定義します。

  • システム・プロキシ

  • HTTP プロキシ

プロキシ・アドレス:プロキシ IP アドレスとポートです。[システム プロキシ]が選択されている場合、このフィールドは自動的に入力され、読み取り専用です。

認証の指定:特定のアカウントを使用して Digital Lab サーバに接続できるようにします。

プロキシ・ユーザ名とパスワード:認証の指定]が選択されている場合に、Digital Lab サーバへの接続に使用される資格情報です。

注:  

  • プロキシ設定が選択されていないと、この接続にプロキシは使用されません。

  • モバイル・アプリケーションに UFT OCR を使用している場合は、Digital Lab サーバに接続するためのプロキシ設定([オプション]>[GUI テスト]>[モバイル]>[プロキシ設定])が OCR のプロキシ設定([オプション]>[GUI テスト]>[テキスト認識]>[プロキシ設定])と同じであることを確認してください。

接続テスト

接続テスト]を押して接続の詳細をテストし、OpenText Functional Testing がクラウド OCR サービスに接続できることを確認します。

プレビュー

アプリケーションの画像をアップロードし、テキスト認識の結果をプレビューし、必要に応じてテキスト認識オプションを調整します。

詳細については、[プレビュー]表示枠([オプション]ダイアログ・ボックス>[GUI テスト]タブ>[テキスト認識])を参照してください。

Tesseract OCR テキスト認識エンジン

UI 要素 説明
テキスト認識モード

アプリケーション内のテキストを認識する方法:

  • 単一テキスト・ブロック・モード:単一テキスト・ブロック・モードでは、当該領域に焦点を合わせ、単一テキスト・ブロックとして扱うよう OCR メカニズムに指示します。このモードは、小さなオブジェクト上または小さなテキスト領域でテキストをキャプチャする場合に役立ちます。オブジェクトのテキストがフォント、サイズ、色、および背景に関して統一されている場合は、このボタンを選択します。

  • 複数テキスト・ブロック・モード:複数テキスト・ブロック・モードでは、オブジェクト内で背景、フォント、およびサイズが異なる各テキスト領域を処理するよう OCR メカニズムに指示します。OCR メカニズムにより、内部アルゴリズムに従ってテキスト・ブロックをどこで分割するかが決定されます。このラジオ・ボタンを選択するのは、オブジェクト上のテキストがさまざまなフォント、フォント・サイズ、色、および/または背景で構成されている場合だけです。

テキスト認識用の記号

テキスト認識を特定の文字に制限できます。

このオプションは英語でのみサポートされます。

現在の言語パック

テキスト認識で使用する現在の言語。一度に使用できる言語パックは 1 つだけです。

新しい言語パックをダウンロードしてインストールするには、Tesseract OCR 言語パックのダウンロードサイト(https://github.com/tesseract-ocr/tessdoc/blob/master/Data-Files.md#data-files-for-version-400-november-29-2016)にアクセスします。

ダウンロードしたら、ファイルを <Installdir>/dat/tessdata4.1 フォルダに追加します。

注: Tesseract のバージョンによっては、Tesseract OCR の結果が異なる場合があります。

標準設定の Tesseract 設定の使用 言語データ・ファイルに記載されている標準の Tesseract 設定を使用するように OpenText Functional Testing に指示します。
ファイルの設定の使用

外部で定義されたファイルから設定をロードできます。

設定オプションの中には、OpenText Functional Testing では使用できないものもあります。[出力]表示枠には、以下のようにテストの実行時に無視されるパラメータのリストが表示されます。

  • %parameter_name% パラメータはサポートされていません。

  • Tesseract OCR エンジンがエラーのため停止しました。Tesseract の設定を確認して、再試行してください。

  • %parameter_name% パラメータの値のタイプが正しくありません。このパラメータはテスト実行中に無視されました。

  • %parameter_name% パラメータは Tesseract OCR エンジンではサポートされていません。

独自の設定ファイルを作成する方法の詳細については、https://github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc を参照してください。

テキスト認識を使用する前に画像を前処理

指定されたオブジェクトまたは領域内のテキストを識別する前に、テキスト認識で画像要素を識別できるようにします。

このオプションを使用すると、OpenText Functional Testing は画像を白黒画像に変換し、サイズを変更します。ただし、これにより、テキスト認識を実行する際の OpenText Functional Testing のパフォーマンスが低下します。そのため、このオプションを使用してテキスト認識を実行する場合は、テストの実行にさらに時間がかかることが予想されます。

このオプションは、アプリケーションで使用されるフォント・サイズが非常に小さい(10 ポイント以下)場合に使用することをお勧めします。