• 導入事例
  • オンプレミス版AI OCRを活用し、OCRプラットフォームの提供とデータ入力業務の効率化を実現
トッパン・フォームズ様

オンプレミス版AI OCRを活用し、OCRプラットフォームの提供とデータ入力業務の効率化を実現

トッパン・フォームズ株式会社様(現 TOPPANエッジ株式会社様)

1955年5月に設立し、「情報」を核とする「インフォメーション領域」で強みを発揮し、従来の紙を中心とした製品・サービスと最先端のデジタル技術を掛け合わせることで、アナログとデジタルの双方向から提供可能な「デジタルハイブリッド企業」。資本金117億5,000万円、従業員数はグループで9,545名(2021年3月末時点)。

導入の背景
・オペレーターの方が紙の仕分け、内容のチェック、記載内容のデータ入力を行っており、そこでの業務の改善や効率化が課題。
導入の効果
データセンターにスキャン画像データを転送。構築したオンプレミス版AI OCRを含む入力用ワークフローシステムにて画像の識別。その後 OCR 処理の指示をかけて、ワークフローシステムの間に、OCR プラットフォームを構築。

明細書や配送伝票などのビジネスフォームの分野で培った経験を活かして、情報伝達における業務効率化に貢献するトッパン・フォームズ株式会社(以下、トッパンフォームズ)。このたび、ビジネスプロセスアウトソーシング(以下、BPO)事業において独自に開発した「手書き帳票AI OCR変換サービス」に、コージェントラボのAI OCRサービスのオンプレミス版である「Tegaki On-Premises」(※)をご活用いただきました。
トッパンフォームズの田村様、猪野様、および実際に製品を評価、開発された株式会社ジェイエスキューブ(以下、ジェイエスキューブ)の中井様にお話をお伺いしました。

※コージェントラボのAI OCRサービス「Tegaki」は2021年12月にリニューアルし、次世代AI OCR/IDPサービス「SmartRead」として生まれ変わりました。
Tegakiの頃よりご好評だった、高い読み取り精度での文字認識に加え、非定型帳票を含めた様々な種類の帳票の読み取りや自動仕分けにも対応するなど、大幅に機能強化されています。

トッパンフォームズについて

まずはじめに、トッパンフォームズについて紹介いただけますか?

田村様:当社はビジネスフォームの分野で培ってきた「情報」を安全かつ適切に行うインフォメーションハンドリングを強みとして、デジタルビジネス事業、インフォメーション・プロセス事業、プロダクトソリューション事業、そしてグローバル事業を手掛けています。

猪野様:従業員数は連結で9,500名程度おります。BPO部門では、パートやアルバイト、人材派遣の方など、センターで働かれている方が数千名おります。BPOセンターは、全国各地に拠点を構えており、入力専門センター、事務局のセンターなどがあります。

現在ご担当されている業務内容について教えてください。


トッパンフォームズ 猪野様

猪野様:バックオフィス業務の効率化のためのサービスを提供しています。ドキュメントの電子化、データ入力、コールセンター、データスクリーニング、不着処理、各種事務局において、扱う帳票の設計運用、保管、処理までのライフサイクルを紙と電子の両方で対応できる体制を整え、サポートを行っています。

導入背景について

「Tegaki On-Premises」導入前の課題や導入のきっかけを教えてください

猪野様:当社の専門処理を行うセンターでは、オペレーターの方が紙の仕分け、内容のチェック、記載内容のデータ入力を行っており、そこでの業務の改善や効率化が課題でした。

当社はもともと貴社と資本関係があったことから(※)、Tegakiやオンプレミス版の製品に関する情報は早くから知っておりました。特にセキュリティの面で、当社の環境内でデータ処理ができることが重要でした。当社では、自社環境内でお客様からお預かりしたデータを処理することが原則のため、オンプレミス版を導入する形になりました。

※トッパンフォームズ ニュースリリースはこちら

他の製品も検討していましたか?「Tegaki On-Premises」をお選びいただいた決め手について教えてください

猪野様:もちろん他社の製品も検討しました。オンプレミス版の製品の評価においては、お客様のパソコンで動作するものと、Tegakiのオンプレミス版のように(サーバで)多くの処理に対応できるものも含めて比較しました。検討事項としては、文字認識率、処理キャパシティ(一定時間にどれぐらいの処理ができるか)、処理速度がポイントでした。

中井様:具体的には、比較対象となる製品それぞれの文字認識率、機能性、システム要件、価格などの複数の観点で点数をつけ、総合点数で全製品を比較しました。各製品の強み・弱みについては、評価している各メンバーに補足ポイントを与え、点数に加点もしくは減点しました。結果として、総合点および文字認識率は「Tegaki」が1番でしたね。

運用について

「Tegaki On-Premises」をどのようにご活用いただいているか、工程を一つずつ教えてください

猪野様:まず運用する拠点でスキャニングし、データセンターに画像データを専用回線で転送します。その後、構築した「Tegaki On-Premises」を含む入力用ワークフローシステムに取り込み、画像の識別をします。その後にOCR処理の指示をかけて、ワークフローシステムの間に、OCRプラットフォームを我々が構築し、APIで処理を指示するための画像の分割などを行い「Tegaki On-Premises」に対して処理の指示をします。読み取り結果をOCRプラットフォームを介して返し、最後にCSVで出力してサイトに返します。CSVデータをお客様システムに取り込み、画面上で帳票の目視検査を行う流れになっています。

もう一つのデータ入力業務としては、OCR処理した後に入力センターで補正点検入力(ベリファイ)をできるようにしました。

OCRプラットフォームについては、今後の拡張性を考慮して作りました。


導入時にぶつかった困難やどう乗り越えたかについて教えてください。

猪野様:当社はファーストユーザーに近い立ち位置で導入を進めていたため、当社内部にも不安の声がありました。文字認識率はクラウド版での検証ができました。しかし、オンプレミス版はリリース前でしたので検証ができず、動作確認やスループットなどのシステム評価に関しては、(プロトタイプとしてあった)アプライアンス版をお借りして評価を行いました。実際にオンプレミス版を提供してもらって本番環境で検証するまでオンプレミス版のパフォーマンスはわからなかったので、貴社を信じるしかありませんでした。しかし、パフォーマンス含めて結果は想定通りだったので良かったです。

運用含め、何か工夫されていることがあれば教えてください。

ジェイエスキューブ 中井様

中井様:システム観点では文字認識率をどう上げるかの工夫をしました。帳票の決まった位置を切り出し、APIで呼び出して文字認識する流れですが、切り出す際に若干ずれていたり、ノイズがある可能性があります。呼び出すアプリケーション側としての事前調整には配慮しました。

特にイメージデータの品質の向上に工夫しました。検証する中で、文字認識率を高めるためには品質の良いイメージデータを投げられるかがポイントだと気付きました。スキャナーで画像処理をできる部分はそこで処理を行い、処理できない部分はアプリケーション側で行いました。試行錯誤を行った結果、かなり高い認識精度が得られるようになりました。

田村様:読み取りやすい帳票を提供することを目指しています。印刷会社なので、帳票の作成および印刷部分も含めてご提案できることが強みです。印刷から取り込みまでやって欲しいというお客様も多いので、帳票の入口から出口まで取り組んでいきたいと思います。

現在の利用状況を教えてください。

猪野様:主に口座振替依頼書等であり、(内容としては)金融機関の口座番号等を読み取ってます。月に数万枚程度を処理しています。

導入効果について

導入後の効果や率直なご感想をお聞かせください。

猪野様:まず想定通りのパフォーマンスが出ました。文字認識結果は項目単位で98.5%になっております。
導入当初に掲げた目標数値は、開発途中で評価していたこともありますが、導入後3ヶ月で達成できました。効果も予想通りでした。

なお導入時に必要となるドキュメントについては、今後の改善を期待したいです。

「Tegaki On-Premises」導入により、エンドユーザーへの提供価値に変化はありましたか?

猪野様:エンドユーザーの方からは、AI OCRの導入による業務改善とその成果、さらに先進的な取り組みを評価していただきました。今後、お客様の他業務への展開も見込めるようになりました。

運用における課題について

運用における課題や要望があれば教えてください。

中井様:読取設定を行うツール「Tegaki Editor」がクラウド版にはあるものの、オンプレミス版には無かったことですね。やはりオンプレミス版にもあった方がシステムに詳しくないお客様の現場でも簡単に対応ができますし、定義の時に利用する未記入の帳票についてもクラウドに出せないケースもありますので。

欲しい機能、ということでは具体的な話になりますが、読み取り結果の上位候補を複数表示する機能が欲しいと思いました。誤りを修正する際、候補の中から選べるとよりスムーズな業務に繋がります。また、(Tegaki Consoleにありますが)確信度ごとに色分けする機能があったり、認識の自信がない文字には不読文字を出したりハイライト機能があるとさらに良いと思います。

今でも十分速いですが、処理速度はさらなる進化を期待したいですね。その他、マスター情報やその他の情報を組み合わせてさらに認識精度が向上できると良いと思います。

今後について

「Tegaki」やコージェントラボに期待することを教えてください。

中井様:最終的には、AI OCRの認識精度が人間のレベルにどこまで近づけられるかだと思います。現在のAI OCRでは、文字を認識した上で関連情報を踏まえて読み取るのが難しいので、将来は帳票上の多角的な情報を読み取り、最適な認識結果を出せることを期待したいです。

猪野様:やはり、AI OCRの一般的な期待値と異なり、文脈から読み取ることが厳しいと思うので、この点が改善できると良いと思います。人間が間違えるところだけ同じように間違える、というふうになってほしいですね。

田村様:やはり認識結果ですね。日本人なりの文字や数字の書き方もあるので、そうした癖を認識に反映できたらさらに良いと思います。最後は人が見ますが、特に数字に関しては限りなく認識率100%に近い方がいいですね。確信度が100%になれば、そこは必ず見ないというふうにしたいです。


サービス資料のダウンロードはこちらから

資料ダウンロード