カーネルコンピュータシステム

PDF2OCR

製品概要

PDF2OCRについて

  • イメージPDFの文字をOCR処理して、テキスト文書へ出力
    通常はイメージPDF内の文字に対し、選択やコピーなどの処理を行えません。
    OCR(文字自動認識)処理を行いテキストデータ(TEXT,RTF形式など)に変換することで、
    その結果に対して検索やコピーなどの処理を行えるようになります。

主な機能

入力処理に関するもの

  • 入力がマルチページファイルの場合、処理を行うページ番号を指定することが出来ます。
  • テキスト形式のPDFからテキスト情報を出力する事が可能です。

出力処理に関するもの

  • OCR処理したテキストデータは下記の形式で出力が可能です。
    • テキスト形式
    • RTF形式
    • HTML形式
    • XML形式
    • XLS形式
    • 透明テキスト付きPDF形式
  • RTF(リッチテキスト)で出力する場合、下記の設定が可能です。
    • 出力文字フォント
    • 出力文字のサイズ
    • 出力文字の色

OCRエンジンに関するもの

  • 文字認識範囲指定が可能(全景(最大A3サイズ)も可能)
  • クリッピング範囲の指定が可能
    • 外部からテキストによる指定
    • 定型サイズから選択
  • 認識処理時に下記情報の出力が可能です。
    • 認識した文字列毎の開始位置
    • 文字の大きさ(高さ)
    • 認識した文字数、など
  • 認識辞書のあるフォルダの指定
  • 学習文字ファイルの指定(ユーザが作成した学習文字ファイルを指定)
  • ノイズの強度の設定
  • 接触罫線の除去
  • 認識させる文字の種別を設定
  • 認識言語の設定
  • 座標原点位置の指定
  • OCR処理範囲の設定

対応データ形式

出力可能なフォーマット(モノクロ/カラー)

  • TEXT
  • RTF
  • XML
  • HTML
  • XLS
  • 透明テキスト付きPDF

簡易マニュアル

Q&Aと関連ページ

動作環境

対応OS

  • Windows 7 (32/64bit)
  • Windows 8 / 8.1 (32/64bit)
  • Windows 10 (32/64bit)
  • Windows 11 (64bit)
  • Windows Server 2008 (32bit版)
  • Windows Server 2008 R2
  • Windows Server 2012 / 2012 R2
  • Windows Server 2016
  • Windows Server 2019
  • Windows Server 2022

価格表

型番 製品名 価格 (税抜)
KD-RAS0656 PDF2OCR 30万円
  • 製品定価にサポート費用は含まれていません。別途サポート費用が必要です。
    >>詳細はこちら
  • 価格は、1台のマシン(1CPU)に対して1インストールの価格設定です(サーバーへのインストール可)。
    購入本数によってボリュームディスカウントがあります。
  • 動作環境が物理環境の場合はCPU数、仮想環境の場合はコア(vCPU)数によって追加費用が必要な場合があります。
    >>詳細はこちら

関連製品

製品名 製品概要
RS2OCR イメージからテキスト情報を抽出
RS3PST_OCR ラスターからPDFへ変換+OCR機能追加版
RSTX3PST_OCR ラスターからPDFへ変換+OCR機能追加版+テキスト合成機能追加版
RSBAR3PST_OCR ラスターからPDFへ変換+OCR機能追加+バーコード+テキスト合成機能追加版

オプション製品

製品名 製品概要
KDCONV_DIR
(階層構造一括変換)
指定フォルダ以下のファイルを一括して変換するオプションプログラム
KDauto_trans
(標準版)
監視フォルダへ入力データを格納することで自動的にデータ変換を行います。
変換結果は、印刷、ファイル転送、指定した別のフォルダへのファイル出力ができます。

更新履歴

2024年3月15日

バージョンアップを行いました。(ver 2.2.5)

2022年5月27日

バージョンアップを行いました。(ver 2.2.4)

  • インストーラーの形式を変更しました。

2022年3月31日

  • Windows XP, Server 2003, Vistaのサポートを終了しました。
TOP