JAPAN AI、画像とテキストを一体的に理解する「マルチモーダルRAG」を実装

AIのプロダクト開発・販売を行うJAPAN AIが、画像とテキストを統合的に理解するマルチモーダルRAGの実装を発表しました。

概要

会社名:JAPAN AI株式会社
所在地:東京都新宿区
代表者:代表取締役社長 工藤 智昭
設立:2023年4月14日
事業内容:人工知能の研究開発、人工知能に関するコンサルティングサービス
URL:https://japan-ai.co.jp/

本機能の実装背景

技術者の退職や異動で、設計図面や作業手順書、品質管理データなどの技術資料が社内で分散管理され、必要な時に適切な情報にアクセスするthingが困難となっていました。この課題解決のため、JAPAN AIでは、テキスト情報検索にRAGを使用し、図面や写真などの視覚的情報に含まれるデータの活用を試みています。

マルチモーダルRAGとは

マルチモーダルRAGは、画像・文書・音声など複数のデータ形式を検索し、その結果を元に生成AIが回答を出力する仕組みです。これにより、技術文書の具体的な数値や仕様を抽出し、回答を生成することが可能になりました。

具体的な使用例

マルチモーダルRAGを使用することで、PDFファイル内のテキストと画像を自動で判別し、両方の情報を一体的に理解して回答を生成することが可能になりました。設計図面の詳細な寸法情報やグラフのデータなどを理解することが可能となりました。

JAPAN AIの今後の展望

JAPAN AIでは、将来的には、過去の設計図面と見積を参照して、類似製品製造時の見積を作成できるようなAIエージェントの開発も予定しています。製造業をはじめとする各業界の業務効率化と技術革新に貢献を続けていきます。

JAPAN AIのサービス概要

JAPAN AIでは、以下のサービスを提供しています。
JAPAN AI AGENT:
https://japan-ai.co.jp/agent/
JAPAN AI MARKETING:
https://japan-ai.co.jp/marketing/
JAPAN AI SALES:
https://japan-ai.co.jp/sales/
JAPAN AI CHAT:
https://japan-ai.co.jp/chat/
JAPAN AI SPEECH:
https://japan-ai.co.jp/speech/
JAPAN AI CONSULTING:
https://japan-ai.co.jp/consulting/

JAPAN AIの親会社について

JAPAN AIの親会社であるジーニーは、日本発の世界的なテクノロジー企業となることを志し、企業の収益拡大・生産性向上などの課題解決につながるソリューションを開発・提供しています。
会社URL:https://geniee.co.jp/
}

関連記事