【更新履歴】

2015/11/13
対応OSを更新しました。
201212/14
透明テキスト付きPDFの出力に対応しました。
2012/12/07
PDF2OCRの製品ページを公開しました。

製品概要

【PDF2OCRについて】

イメージPDFの文字をOCR処理して、テキスト文書へ出力

通常はイメージPDF内の文字に対し、選択やコピーなどの処理を行えません。

OCR(文字自動認識)処理を行いテキストデータ(TEXT,RTF形式など)に変換することで、その結果に対して検索やコピーなどの処理を行えるようになります。

サポートフォーマット

出力可能なフォーマットは以下の通りです。

表 1. サポートフォーマット
出力可能なフォーマット
  • TEXT
  • RTF
  • XML
  • HTML
  • XLS
  • 透明テキスト付きPDF

主な編集機能

【入力処理に関するもの】

  • 入力がマルチページファイルの場合、処理を行うページ番号を指定することが出来ます。
  • テキスト形式のPDFからテキスト情報を出力する事が可能です。

【出力処理に関するもの】

  • OCR処理したテキストデータは下記の形式で出力が可能です。
    • テキスト形式
    • RTF形式
    • HTML形式
    • XML形式
    • XLS形式
    • 透明テキスト付きPDF形式
  • RTF(リッチテキスト)で出力する場合、下記の設定が可能です。
    • 出力文字フォント
    • 出力文字のサイズ
    • 出力文字の色

【OCRエンジンに関するもの】

  • 文字認識範囲指定が可能(全景(最大A3サイズ)も可能)
  • クリッピング範囲の指定が可能
    指定方法は下記の通りです。
    • 外部からテキストによる指定
    • 定型サイズから選択
  • 認識処理時に下記情報の出力が可能です。
    • 認識した文字列毎の開始位置
    • 文字の大きさ(高さ)
    • 認識した文字数、など
  • 認識辞書のあるフォルダの指定
  • 学習文字ファイルの指定(ユーザが作成した学習文字ファイルを指定)
  • ノイズの強度の設定
  • 接触罫線の除去
  • 認識させる文字の種別を設定
  • 認識言語の設定
  • 座標原点位置の指定
  • OCR処理範囲の設定

【バッチ処理に関するもの】

  • バッチファイル名
    • 指定されたファイル又はディレクトリ内のファイルを一括処理したい時に利用します。

簡易マニュアル

PDF2OCRについて記載した簡易マニュアルをPDFファイルでダウンロードできます。

Q&Aと関連ページ

動作環境

【対応OS】

Windows XP  Windows XP (SP3以降)(32bit版)

Windows Server 2003  Windows Server 2003 (SP1以降)(32bit版)

Windows Vista  Windows Vista (32bit版)

Windows Server 2008  Windows Server 2008 (32bit版)

Windows 7  Windows 7 (32/64bit)

Windows Server 2008  Windows Server 2008 R2

Windows 8  Windows 8 / 8.1 (32/64bit)

Windows Server 2012  Windows Server 2012 / 2012 R2

Windows 10  Windows 10 (32/64bit)

価格表

表 2. RS2OCRの価格表
型番 製品名 製品概要 価格 (税抜き)
KD-RAS0656 PDF2OCR

PDFデータの文字をOCR処理してテキスト変換

30万円

※製品定価にサポート費用は含まれていません。別途サポート費用が必要です。

  >>詳細はこちら