脳の視覚情報処理と演算方法を利用した人工知能(AI)技術
-手書き帳票からのデータ入力の生産性を向上

課題

業務のデジタル化や自動化が進む現在、依然として人手に頼ることが多い業務の一つに、紙帳票によるデータ入力作業があります。例えば、銀行や保険会社などでは、多くの紙帳票が使われています。紙帳票に書かれた手書き文字をコンピュータ入力する作業では、入力ミスや抜け漏れの可能性があるため、二人の担当者で相互確認することで対応してきました。そのため、作業人数の確保が課題の一つとなっています。

技術紹介

当社は、複雑な手書き文字を高い精度で認識するAIを活用した手書き文字認識技術を開発しました。
この技術の特徴は、人の脳がモノを認識する際の視覚情報処理の仕組みと、脳が文字を判断する際の演算方法を組み合わせ、複雑な手書き文字を高い精度で認識します。手書きの日本語文字列は、文字の幅や文字間隔が一様ではなく、また、文字境界が不明確なため、単純に単文字領域を特定することは困難です。そこで、本技術では、1文字分の画像を認識する「単文字認識技術」と単文字認識結果を組み合わせて文字列認識を行なう「文字列認識技術」で構成しています。

「単文字認識技術」

単文字認識技術では、脳が文字を判読する仕組みを応用し、特定の傾きの線分を抽出する処理を階層的に組み合わせることで、複雑な形状を認識することが可能です(図1)。本技術は、大量の文字画像と文字コードの組み合わせを学習することで、手書き文字、特に漢字の単文字認識が可能になりました。

図1 単文字認識技術

「文字列認識技術」

文字列認識技術は、自然言語処理で用いられるAI技術の1つ、Conditional Random Field(CRF)手法を適用し、入力された文字列画像に対して文字列テキストを出力します。さらに、文字境界とテキスト列を同時に推定する方法を適用し、文字列パターンに対して、生起確率注記が最も高い文字列パターンを採用します。そして、生起確率から認識確信度を算出し、認識確信度が十分に高い場合は、文字認識の結果をそのまま利用できます。これにより、従来のアウトプット品質を維持したまま、人手工数の削減と業務改革を実現することが可能です。

  • 注記 生起確率 出力した文字列が正しいであろう確率

提供価値

  • 金融業をはじめ、公共機関やさまざまなサービス業など、手書き帳票を大量に扱うお客様の業務プロセスの効率化を強力に支援します。