ホーム > スキャニングサービス > 電子化・スキャニング用語集
スキャニング解像度とは
解像度とは「どのくらい精細に、細かくスキャニングするか」ということです。dpi(dot per inch)という単位が用いられており、「300dpi」という場合、「1インチ(=25.4mm)幅を300個の点(=画素)で表現する」という意味です。解像度を上げると画像はきれいになりますが、ファイルサイズが大きくなります。解像度を下げるとファイルサイズが小さくなりますが、画像は粗くなります。
画質とファイルサイズのバランスを考えて解像度を選択する必要があります。よく使われる解像度には、200dpi、300dpi、400dpi、600dpiがあり、目安としては「200dpiは『見えればいいや』という感じ。社内用途」、「400dpiは、他のお客様に渡したりする用途、記録保存」といった感じです。アシストVでは、社内利用文書=200dpi/300dpi、社外資料=300dpi/400dpiのあたりをおすすめします。
モノクロ・カラー・グレースケールについて
主に3つのパターン、「モノクロ」「グレースケール」「フルカラー」があります。カラーの原稿を必ずしもカラーで電子化する必要はなく、モノクロで十分なケースもありますが、モノクロにすることで文字が見えなくなるケースもあるので注意してください。
- モノクロ 1つあたりの画素は、真っ黒か真っ白かの状態しかありません。画像の文字部分は表示がクリアになり、ファイルサイズも小さくなりますが、写真のようなハーフトーンの表現は上手ではありません。
- グレースケール 1つあたりの画素は、真っ黒から真っ白までに256階層が表現されるので、白黒画像ですが写真部分がきれいに表現できます。モノクロに比べファイルサイズが大きくなります。
- フルカラー 1つあたりの画素を24ビットカラー(約1677万色)で表現し、ファイルサイズがとても大きくなります。
ADFスキャニングと手置きスキャニングについて
ADFスキャニングのADFはAuto Document Feedable の略で、自動原稿送り装置で行うスキャニング方法です。
一括でたくさんの書類スキャニングができるので手置きスキャニングと比べて金額が安くなります。
報告書・申込書や断裁した本など、1枚ペラの書類が対象です。
手置きスキャニングは、ADFでスキャンできないため、1枚ずつスキャニングします。
すべて手作業のため、ADFスキャニングと比べて金額が高くなります。
本、袋とじ契約書、劣化が激しい書類などが対象です。
ファイルフォーマットとは?
電子化した納品データで一般的に使われているファイルフォーマット(PDF、Docuworks、Tiff、Jpeg)について特徴をまとめてみました。
PDF形式 Adobe(アドビ)社が開発した文書フォーマットです。世界的に有名な、文書形式のデファクト・スタンダードです。OCR処理した透明テキストを埋め込んで検索性を高めたり、ファイルにパスワードをかけてセキュリティを高めたりすることも可能です。文書を開くためには、無償の
「Adobe Reader」
をインストールすることが必要です。
XDW形式 富士ゼロックス社が開発した文書フォーマットで、動作が軽快であることも特長です。機能はPDF形式に似ていますが、日本のオフィスワークを考えて作り込まれており、日本では300万本以上販売され根強いファンが多くいます。海外ではあまり知られていない文書フォーマットなので、海外にファイルを送付する方にはおすすめしません。文書を開くためには、無償の「DocuWorks Viewer Light」
をインストールすることが必要です。
TIFF(G4圧縮)形式 モノクロ画像の保存によく用いられる画像フォーマットです。圧縮率が高いので、ファイルサイズの軽減がはかれます。圧縮方式は可逆圧縮なので、画像が劣化することはありません。カラー画像には対応していません。後述のJPEG形式と異なり、1つのファイルに複数のページを保持する(マルチページ)機能を持っています。WindowsXPでは表示が遅いので、専用の画像ビューワーを使うことがおすすめです。国際規格なので、モノクロ画像の長期保存に向いています。
JPEG形式 カラー画像の保存によく用いられる画像フォーマットです。圧縮率が任意に指定できるので、ファイルサイズの軽減と画質のバランスをとることができます。圧縮方式は非可逆圧縮なので、保存をする毎に画質が劣化していきます。一度画質を落とすと元に戻せません。1つのJPEGファイルは画像を1つ保持し、複数ページには対応していません。モノクロ画像をJPEG形式にするのは、画像が荒れるのでおすすめしません。ホームページによく使う画像フォーマットです。WindowsXPでそのまま画像を開くことができます。TIFF同様、国際規格として認められています。
もちろん、これ以外のフォーマットでもお客様のご希望の形式になるべく対応いたしますのでご相談ください。また、最新の技術に追随すべく、JPEG2000やJBIG2への変換も行っています。JPEG2000は従来のJPEGフォーマットよりも高圧縮・高画質を実現するカラー画像のフォーマットであり、JBIG2は従来のTIFF(G4圧縮)を画質を落とさずさらに高圧縮化するフォーマットです。
ファイル名設定・束ねる単位について
アシストVでは お客様の検索・利用目的に応じて適切なファイル名の設定・束ねのルールを提案しています。
バインダーに保管されている契約書を例に考えてみましょう。
利用頻度が高い契約書の場合、契約書単位でPDFファイルを作成し、契約書を探すときにキーとなる項目(契約書番号、顧客名、日付など)をファイル名もしくはデータベースを作成する事で、必要な時に素早く検索ができ便利になります。
記録目的で閲覧頻度が低い書類の場合、細かくファイル分割したり、データベースを作成メリットがあまりないので、バインダー単位で1つのPDFに束ねて、スキャニングの作業費用を抑える提案をさせていただいております。
OCR処理について
印刷された原稿などをスキャニングし、画像から機械的に文字部分を認識しテキストを抽出する処理。
Wordなどで作成された活字文書は高精度だが、手書き文書については精度があまり良くないです。
活字・手書きの他に、表レイアウト・フォント・文字の大きさ、文字の擦れ具合、スキャニング解像度など様々要因で文字認識精度が変わってきます。
※OCRとはOptical Character Recognition の略で光学文字認識のこと。