【PDF2OCR】PDFをOCRしテキストを抽出

本文へ

PDF2OCR

お知らせ

2025年3月7日：こちらの製品につきまして、新規のご注文を一時的に停止しております。

製品概要

PDF2OCRについて

イメージPDFの文字をOCR処理して､テキスト文書へ出力
通常はイメージPDF内の文字に対し､選択やコピーなどの処理を行えません。
OCR(文字自動認識)処理を行いテキストデータ(TEXT,RTF形式など)に変換することで、
その結果に対して検索やコピーなどの処理を行えるようになります。

主な機能

入力処理に関するもの

入力がマルチページファイルの場合、処理を行うページ番号を指定することが出来ます。
テキスト形式のPDFからテキスト情報を出力する事が可能です。

出力処理に関するもの

OCR処理したテキストデータは下記の形式で出力が可能です。
- テキスト形式
- RTF形式
- HTML形式
- XML形式
- XLS形式
- 透明テキスト付きPDF形式
RTF(リッチテキスト)で出力する場合、下記の設定が可能です。
- 出力文字フォント
- 出力文字のサイズ
- 出力文字の色

OCRエンジンに関するもの

文字認識範囲指定が可能(全景(最大A3サイズ)も可能)
クリッピング範囲の指定が可能
- 外部からテキストによる指定
- 定型サイズから選択
認識処理時に下記情報の出力が可能です。
- 認識した文字列毎の開始位置
- 文字の大きさ(高さ)
- 認識した文字数、など
認識辞書のあるフォルダの指定
学習文字ファイルの指定(ユーザが作成した学習文字ファイルを指定)
ノイズの強度の設定
接触罫線の除去
認識させる文字の種別を設定
認識言語の設定
座標原点位置の指定
OCR処理範囲の設定

対応データ形式

出力可能なフォーマット(モノクロ/カラー)

TEXT
RTF
XML
HTML
XLS
透明テキスト付きPDF

簡易マニュアル

pdf2ocr.pdf

Q＆Aと関連ページ

RS2OCR/PDF2OCRに関するQ&A
PDF関連製品
(PDF関連製品をまとめたページです。)
OCR関連製品
(OCR関連製品をまとめたページです。)

動作環境

対応OS

Windows 7 (32/64bit)
Windows 8 / 8.1 (32/64bit)
Windows 10 (32/64bit)
Windows 11 (64bit)
Windows Server 2008 (32bit版)
Windows Server 2008 R2
Windows Server 2012 / 2012 R2
Windows Server 2016
Windows Server 2019
Windows Server 2022

価格表

型番	製品名	価格 (税抜)
KD-RAS0656	PDF2OCR	~~30万円~~

製品定価にサポート費用は含まれていません。別途サポート費用が必要です。
>>詳細はこちら
価格は、1台のマシン(1CPU)に対して１インストールの価格設定です(サーバーへのインストール可)。
購入本数によってボリュームディスカウントがあります。
動作環境が物理環境の場合はCPU数、仮想環境の場合はコア(vCPU)数によって追加費用が必要な場合があります。
>>詳細はこちら
こちらの製品につきまして、新規のご注文を一時的に停止しております。

関連製品

製品名	製品概要
RS2OCR	イメージからテキスト情報を抽出
RS3PST_OCR	ラスターからPDFへ変換+OCR機能追加版
RSTX3PST_OCR	ラスターからPDFへ変換+OCR機能追加版+テキスト合成機能追加版
RSBAR3PST_OCR	ラスターからPDFへ変換+OCR機能追加+バーコード+テキスト合成機能追加版

オプション製品

製品名	製品概要
KDCONV_DIR (階層構造一括変換)	指定フォルダ以下のファイルを一括して変換するオプションプログラム
KDauto_trans (標準版)	監視フォルダへ入力データを格納することで自動的にデータ変換を行います。変換結果は、印刷、ファイル転送、指定した別のフォルダへのファイル出力ができます。

更新履歴

2025年1月24日

バージョンアップを行いました。(ver 2.2.9)

2024年6月28日

バージョンアップを行いました。(ver 2.2.8)

2024年5月24日

バージョンアップを行いました。(ver 2.2.7)