実用化の進む画像認識技術 - 映像処理エンジンの登場で普及拡大へ - CEATEC JAPAN 2008にみる技術動向③

実用化の進む画像認識技術 - 映像処理エンジンの登場で普及拡大へ
CEATEC JAPAN 2008にみる技術動向③

 画像認識技術が様々な製品に実装されより身近になりつつある。
 情報家電のハイビジョン化を加速する映像処理エンジンが担うアプリケーションとして有望なものの一つに画像認識がある。CEATEC JAPAN 2008 において、製品として実用化された画像認識処理やこれからの普及が期待される分野を取材した。

製品レベルでの実用化が進む画像認識技術

図1:一般的な画像認識処理の基本形態*1 一般的な画像認識処理の基本形態*1
図2:ソニーのハイビジョン・ビデオカメラに搭載されている顔検出機能「顔キメ ビデオ」 ソニーのハイビジョン・ビデオカメラに搭載されている顔検出機能「顔キメ ビデオ」
図3:顔検出機能「顔キメ ビデオ」を搭載したビデオカメラで顔を認識している様子 顔検出機能「顔キメ ビデオ」を搭載したビデオカメラで顔を認識している様子
図4:日立製作所のハイビジョン・ビデオカメラに搭載の顔検出機能「顔ピタ」 日立製作所のハイビジョン・ビデオカメラに搭載の顔検出機能「顔ピタ」

 映像処理エンジンの用途としては、既報の通りハイビジョンにおける高画質化やコーデックへの適用があるが、負荷の高い処理が多いことから画像認識も有望であるとされている。

 画像認識では、入力した画像を補正したあと特徴抽出し、それを標準パターンのデータと照らし合わせて識別、認識を行い、その結果を出力する。(図1)画像認識を応用した技術分野には、バイオメトリクス(生体認証)、マシンビジョン、リモートセンシング、マンマシン・インタフェース、医療用画像認識など様々なものがある。

 応用する分野によって、認識あるいは検出を行う対象も人間の顔、手、指紋、静脈、目の虹彩などから、プリント基板の配線形状、製品の傷、など様々である。画像認識処理において対象の検出のみであれば演算負荷はそれほど高くない一方、生体認証など個体の識別・認証まで行う場合にはさらに演算量が増えるため、その処理にはより高性能なハードウェアが必要となる場合が多い。

 画像認識技術で最も話題を集めている技術の一つが、今回のCEATECでも多くのメーカーが製品を展示していた顔検出技術である。顔検出は昨年のCEATECにおいて静止画像を扱うデジタルカメラでの搭載が話題となっていたが、今年はハイビジョン・ビデオカメラへの顔検出技術搭載が目立っていた。

 ソニーのブースでは、同社が今年4月に発表したデジタルハイビジョン「ハンディカム HDR-TG1」を展示していた。HDR-TG1では静止画と動画のいずれでも顔検出機能により8名までを検出可能であり、ピントや露出、肌の色などを制御してきれいな動画が撮影できることを実機でのデモンストレーションにより来場者に示していた(図2、3)。

 日立製作所は、8月に発売開始したAVCHD対応ハイビジョン・ビデオカメラ「ブルーレイカム Wooo DZ-BD10H」を展示、顔検出機能「顔ピタ」を搭載し、逆光時や被写体が画面中央に無い場合でも美しい映像撮影が可能であることをアピールした(図4)。

 顔検出技術は民生用のデジタルカメラやビデオカメラ以外にも、テレビ会議システムなどにおいても実装が進みつつあり、高付加価値化により製品の差異化を図りたいメーカーがしのぎを削っている。また、顔検出よりさらに演算負荷がかかる顔認識技術も監視カメラやセキュリティ・システム、入出国管理システムなどでの導入や適用が始まっており、ハードウェア、ソフトウェアいずれも研究開発が盛んな分野となっている。

期待されるマンマシン・インタフェースへの応用

 画像認識技術の応用として今後期待されているのが、マンマシン・インタフェースへの応用である。パソコンや携帯電話、DVDレコーダーなどの情報家電などが高機能化、多機能化するにしたがって、その操作が複雑になり、製品機能のごく一部しか使用しないということが多くなっている。いわゆる”デジタルディバイド”という問題にも象徴されるように、情報機器を誰でも簡単に操作できるようにすることには確実なニーズがあるにもかかわらず、操作が複雑で難しいために情報格差の一因となっていることもしばしば指摘される。

 このようなマンマシン・インタフェースの課題に対する新しい取り組みとしては、例えば東芝が今年発売開始した同社のAVノートパソコン「Qosmio」に「ジェスチャー・リモコン」の搭載があり、徐々に実用化が始まっている状況である。

 今年の東芝セミコンダクター社ブースでは、ジェスチャー・リモコンのデモンストレーションであった昨年のDVDプレーヤーとは趣を変え、「新感覚癒し系アプリケーションTouch Sweet ぱらちゃん*2」をブース内の参考出展とステージ・セミナーによって披露していた。(図5)

図5:東芝セミコンダクター社のSpursEngine用ハンドジェスチャ認識ミドルウェアを使用したデモンストレーション
「Touch Sweet ぱらちゃん」
東芝セミコンダクター社のSpursEngine用ハンドジェスチャ認識ミドルウェアを使用したデモンストレーション「Touch Sweet ぱらちゃん」
 
東芝セミコンダクター社のSpursEngine用ハンドジェスチャ認識ミドルウェアを使用したデモンストレーション「Touch Sweet ぱらちゃん」
図6:東芝セミコンダクター社のハンドジェスチャでぱらちゃんを操作するセミナー参加者 東芝セミコンダクター社のハンドジェスチャでぱらちゃんを操作するセミナー参加者

 「Touch Sweet ぱらちゃん」は、東芝の映像処理エンジン「SpursEngine」用のハンドジェスチャ認識ミドルウェアを使用して同社のエンジニアが今回のCEATEC出展のために短期間で開発したという簡単なゲーム・アプリケーションである。ブース内セミナーでは、会場の来場者にもジェスチャーによるインタフェースでゲームを体験してもらい、ぱらちゃんを手のジェスチャーで操作してスコアを競わせるなど趣向を凝らしていた。(図6)

 パソコンにおけるジェスチャー・インタフェースとしては、米Apple社の Mac OS X 上で動作するオープンソースのソフトウェア「touché」の例もある。(米Google社のサイト「Google Code」経由で提供中。)touchéはオーストリアの Georg Kaindl氏が開発したライブラリで、米Intel社が開発し後にオープンソースとして公開したクロスプラットフォームの画像認識ライブラリ「OpenCV」も活用している。
 国内では、「Cell/B.E.」のソフトウェア開発に特化したベンチャー企業であるフィックスターズが、OpenCVを Cell プロセッサ上で高速化するモジュール「CVCell」を発表するなどの動きもあり、SpursEngineでCVCellの技術が活用されるなどの展開も考えられる。

*1: ^ 特許庁ホームページ、1.4 画像認識技術の要素技術 1.4.1 画像認識システムの基本形態を元に HD Processing Forum 編集部が作成
*2: ^ 「ぱらちゃん」は東芝PC&ネットワーク社のイメージキャラクターであり、パソコンのデスクトップ・アクセサリーソフトウェアや販促グッズなどに使用されている。


HD Processingフォーラム | 特集記事 | CEATEC JAPAN 2007 動画レポート | イベント&セミナー情報