画像の圧縮復元・認識
画像の圧縮・復元モデルと認識モデルのEnd-to-End学習

Project Details
- Start : 2022.4
- Collaborator : 柴田蓮
概要
エッジコンピューティングを活用した画像認識システムは,通信量が増加するとネットワークの負担が大きくなるため通信速度が低下する問題が発生する. 通信量削減のために圧縮・復元した画像を認識するアプローチが提案されたが,未圧縮の画像を用いて認識する場合と比べて認識精度が低下することが報告されている. そこで,本稿では画像を圧縮・復元するモデルと認識するモデルを End-to-End で学習するフレームワークを提案する. 提案手法は,異なる 2 つのモデルを End-to-End で学習することで,画像を圧縮・復元した際に認識に有効な情報の欠落を防ぐことが可能となり, 高精度な画像認識の実現が期待できる.
提案手法
画像の圧縮復元・認識フレームワークの提案
本研究では画像の圧縮復元モデルと認識モデルを結合したフレームワークを提案する. フロントエンドデバイス側でエンコーダにより圧縮した情報を送信することで高速かつ低遅延なデータ通信を実現する. 圧縮された情報はサーバー側でデコーダにより画像として復元後,深層学習モデルを用いた画像認識を行う.

提案するフレームワーク
画像の圧縮復元モデル
画像の圧縮復元モデルには,リカレントニューラルネットワーク(RNN)ベースの再帰型オートエンコーダを採用した. 1度の処理により得られた復元画像と入力画像の差分画像を出力し,再びオートエンコーダに入力する. この処理を再帰的に繰り返し,得られる複数の復元画像を合成し最終的な出力画像とする. 繰り返す回数を制御することで,出力画像の画像品質を制御可能となっている.

再帰型オートエンコーダの概要
画像の圧縮復元モデルと認識モデルのEnd-to-End学習
画像の圧縮復元と認識モデルを結合しEnd-to-Endに学習する. 圧縮復元モデルは認識処理に有効な情報を優先した情報圧縮や認識を妨げるノイズの発生を抑制した圧縮復元処理が可能となる. 認識モデルは圧縮復元モデルから出力される画像に基づく高精度な認識が可能となる.
評価実験と結果
ImageNet-100を用いた画像分類タスクにより性能評価を行った. 圧縮復元モデルと認識モデルを個別に最適化後,結合し1つのフレームワークと比較を行い, 提案手法は2.3~8.2%優れた認識精度を達成しました. 未圧縮画像と比較し,最大で98.8%のデータ量の圧縮を達成しました.

画像認識精度
圧縮復元画像
従来手法と提案手法の圧縮復元画像を比較した結果,提案手法はノイズの発生を抑制した画像を得ることができました.

圧縮復元画像の例