リコーは2026年3月30日、独自にファインチューニングしたマルチモーダルLLM「Qwen3-VL-Ricoh-32B」を開発したと発表した。320億パラメータの同モデルは、複雑な図表を含む日本語文書の理解・推論においてGoogleのGemini 2.5 Proに匹敵する性能を達成している。

Alibaba Qwen3-VLベースに日本語特化チューニング
Qwen3-VL-Ricoh-32Bは、AlibabaのAIモデル「Qwen3-VL-32B-Instruct」をベースに開発された。リコーが独自に用意した学習データを用い、段階的に特定のタスクに最適化するファインチューニングを実施。複雑なフローマや複数ページにわたるグラフなどの画像を含む日本語文書を正確に理解し、推論できる能力を獲得した。
開発では以下の工夫が施された:
- 強化学習:AIが推論を試行錯誤し、結果に応じた新しいことに出力を改善する学習手法を導入
- 日本語推論出力:出力の正確性に加え、日本語による推論の出力にも報酬を設定する工夫を実施
- 画像トークン削減技術:AI推論時の画像トークン数を減らす技術を開発し、運用コストの削減に貢献
Gemini 2.5 Proに匹敵する性能
図表を含む日本語の文書理解をもとに推論する性能を測るベンチマークでは、Gemini 2.5 Proに匹敵する性能を確認したとアピールしている。また回答の根拠をグラフなどから日本語で確認できるのも特徴だ。
独自AIプラットフォーム「H.D.E.E.N」で展開
リコーは、独自のAIプラットフォーム「H.D.E.E.N」(ひでん)を通じて法人向けAIサービスを展開している。同社の室井年宏氏(リコーデジタルサービスビジネスユニット AI サービス本部 AI技術開発センター所長)は、リコーのAI開発戦略について「AIモデル単体でビジネスしようとは考えていない」と説明。Qwen3-VL-Ricoh-32BもH.D.E.E.Nなどを通じて提供される。
「自社で手掛けることで獲得できる技術やノウハウを、顧客にソリューションとして提供できる」── 室井年宏氏(リコー AI技術開発センター所長)
GENIACプロジェクトの成果
本モデルの開発は、経済産業省の国産AI開発支援プロジェクト「GENIAC」第3期の補助を受けて実施された。軽量版の「Qwen3-VL-Ricoh-8B」もHugging Faceで公開されているほか、画像を含む文書理解をもとに推論する性能を測るリコー独自のベンチマークも公開予定だ。
国内企業による実用的なマルチモーダルLLM開発の好例として、日本のAI開発力を示す事例といえる。
参考:ITmedia AI+

