企業内に蓄積された文書や画像などの非構造化データを分析・整理し、価値ある情報へと変換。あらゆる形式で散在する非構造化データを構成要素に分解し、複数の専門的なAIにより、業界・企業固有の意味理解や、マスキングなどの前処理を行います。それにより、形式の異なるデータ間でも横断的に分析・活用できるようになります。
Assignment
DX・AI活用における構造化
企業活動を通じて生成される情報(ナレッジ・ノウハウ)は加速度的に増加。その86%以上は非構造化データであり、DX推進における大きな障壁となっています。
※2025年時点
※IDC, Worldwide Global DataSphere Structured and Unstructured Data Forecast, 2025–2029, #US52806725 August 2025に基づき、富士フイルムビジネスイノベーションが作成
また、非構造化データはAIによる情報抽出の難易度が高く、抽出したデータも表記ゆれが起きたり、データ同士の紐づけが困難だったり、利活用に最適化したデータ補正が困難になっています。
ドキュメントを中心とした非構造化データを構成する要素を分解し、それぞれの関係性を一定の規則に即して整理することで、形式の異なるデータを横断的に分析・活用可能な価値のある「企業の知」へと変換します。特に、複合機やドキュメントコミュニケーションを長年追求してきた当社ならではの「画像処理AI」や「言語処理AI」を組み合わせている点が特徴的。より業務に即したデータの構造化を実現し、ビジネスに役立つデータのAI利活用を支援します。
技術01 画像処理AI
「FAXの画質改善」や「地紋/紙しわ除去」などを行い、AIが読み取りやすい形式へ画像処理を行います。
技術02 言語処理AI
データに紐づく複数の属性情報から統合的に意味を理解し、「表記ゆれ補正」や「異なる情報間の紐付け」、「特定情報検出」を行うことで、利活用に最適な形式へ変換します。
01 文書を理解して情報抽出
従来、多大な労力をかけて行っていた帳票からの情報抽出をAIにより効率化します。
02 重要情報を見つけてマーキング
特定の公開不可情報が含まれ、配布前にマスキングが必要な情報や、図面の寸法など特定情報のハイライトが必要なドキュメントについて、利活用前の特定情報抽出処理を行います。
03 複数のデータを突合・紐付け
2つ以上のデータを比較し、AIが自動でリンクさせます。例えば、入金請求突合業務においては、入金データに対し複数の請求データがある場合もAIが関連性を見つけ出し突合。また、申込書と受発注システムの名称に揺らぎがあるケースでは、類似度を判定し名寄せします。
04 文書を判別し自動仕分け
データを属性ごとに振り分けます。例えば問い合わせ対応窓口では、AIが問い合わせ内容を理解し、引継ぎ先の部署を推論。また、請求書から勘定科目への分類するなど、その後の業務のDX化を支援します。