人生にゲームをプラスするメディア

【CEDEC 2009】SCEが画像認識を語る~「画像認識技術とゲーム・インターフェイス」

コンピューターが画像を認識する。近年注目の技術ですが、その鍵は「引き算」にあるようです。株式会社ソニー・コンピュータエンタテインメントの鈴木 健太郎氏、掛 智一氏と、ソニー株式会社の尾上 直之氏と大久保 厚志氏が画像認識の不思議を解き明かしてくれました。

ゲームビジネス その他
 【CEDEC 2009】画像認識技術とゲーム・インターフェイス
  •  【CEDEC 2009】画像認識技術とゲーム・インターフェイス
  •  【CEDEC 2009】画像認識技術とゲーム・インターフェイス
  •  【CEDEC 2009】画像認識技術とゲーム・インターフェイス
  •  【CEDEC 2009】画像認識技術とゲーム・インターフェイス
コンピューターが画像を認識する。近年注目の技術ですが、その鍵は「引き算」にあるようです。株式会社ソニー・コンピュータエンタテインメントの鈴木 健太郎氏、掛 智一氏と、ソニー株式会社の尾上 直之氏と大久保 厚志氏が画像認識の不思議を解き明かしてくれました。

掛氏は、デジタル画像=ピクセル(画素)の集まりであり、これを取り出して演算するのが「画像処理」であり、ぼかし、シャープ化、エッジ検出といった処理はいずれも計算の元で行われている……と語ります。

画像認識に欠かせないのが「二つの画像が似ているのか否か、比較すること」ですが、実はこの比較は引き算で行われています。ピクセルも突き詰めれば数字になるので、Aという画像を構成するピクセル(の数値)からBのピクセル(の数値)を引き算するのです。0になれば完全に同じ画像、差が大きければ違った画像、小さければ良く似た画像となります。こうした計算は「パターンマッチング」(類似度計算)と呼ばれています。

動画、といっても突き詰めれば静止画の集合体なので、「1コマ目の画像-2コマ目の画像」と引き算すれば、その差が「動いた部分」となり、動きを認識できるという訳です。常に画面全体を比較していたのでは計算回数が多くなりすぎます。そこで、限定した範囲をサーチする「ローカルサーチ」で負荷を減らしていきます。例えば、顔や手が一瞬で1mも2mも動くことは普通あり得ません。ですから、常時画面全体をサーチする必要はなく、常識的に動くであろう範囲のみを見れば良いわけです。画像認識の世界では色が扱われることはなく、輝度の8ビットのみ。カラーだと処理が重くなりますし、色情報は扱いが難しいと掛氏は指摘します。

エンターテイメントロボットの顔認識などを手がけた大久保氏は、ソニーの顔認識が「顔検出→顔パーツ検出→顔属性検出→顔識別」といった手順で行われていると明かします。ソニーの顔認識は20×20ピクセルを最小単位として、あらゆる人種の老若男女の顔を検出可能。さらに顔が笑顔であるかどうかの属性も判断できるといいます。

画像データはグレースケール化され、統計的な顔データを集めた「顔検出辞書」と照合することにより、“そこに顔があるかどうか”が判断されます。目・鼻・口といったパーツは「パーツ辞書」から検出され、「属性辞書」が笑顔かどうか、大人なのか子供なのか、男性なのか女性なのかという属性を判断。個人識別は、自分の顔を登録した個人用の辞書と照合することで行われるといいます。

照合は画像のサイズを変えながら何度も繰り返されるのですが、画像のサイズが大きく、深い奥行きまで検知するのであれば計算回数も多くなります。640ピクセルの画像であれば20万回、480ピクセルなら10万回……と画像が小さくなれば精度は落ちるものの計算回数は劇的に少なくなっていきます。ゲームに顔認識を使うのであれば、奥行きを限定することで処理を軽くできる、と大久保氏は語ります。

プレイステーション3の顔認識はほぼSPUのみで行われるため、複数のSPUを割り当てることで高速化を実現。カメラに写った人の顔をアバターの顔に置き換え、口を開けたり目線を動かしたりと表情を同期させることも可能といいます。顔の認識に使われる各種辞書はソニーのグループ全体でシェアされており、デジカメを始めとした様々な製品に使用することで精度と効率が高められています。デモンストレーションが行われたのはプレイステーション3のみでしたが、PSP用の顔認識ライブラリも近日中に提供予定とのことで、実現すればゲームの可能性がさらに広がりそうです。
《水口真》
【注目の記事】[PR]

編集部おすすめの記事

ゲームビジネス アクセスランキング

  1. 「日本と海外におけるゲーマーにとってのリージョン制限」・・・イバイ・アメストイ「ゲームウォーズ 海外VS日本」第22回

    「日本と海外におけるゲーマーにとってのリージョン制限」・・・イバイ・アメストイ「ゲームウォーズ 海外VS日本」第22回

  2. 令和に新作ファミコンカセットを自作!その知られざるテクニック&80年代カルチャーを「桃井はるこ」「なぞなぞ鈴木」らが語る【インタビュー】

    令和に新作ファミコンカセットを自作!その知られざるテクニック&80年代カルチャーを「桃井はるこ」「なぞなぞ鈴木」らが語る【インタビュー】

  3. マリオの資産は1160億円―フォーブスのランキング

    マリオの資産は1160億円―フォーブスのランキング

  4. 【レポート】VRロボゲー『アーガイルシフト』のロマンと没入感が凄い!男の子の夢、これで叶います

  5. 物理ベースでの絵作りを通して見えてきたもの/アグニのデザイナーが語るリアルタイムワークフロー・・・スクウェア・エニックス・オープンカンファレンス2012

  6. 任天堂がマイクロソフトにレア社を売却した経緯とは・・・3億7500万ドル巨額買収の裏側

  7. FPS界の重鎮“スタヌ”って何者?山田涼介も憧れる人気ストリーマー・StylishNoobの魅力

  8. 【史跡探訪】トランプ・かるた製造元「山内任天堂」旧本社

  9. フロム・ソフトウェア、役員人事を発表 ― 会長に角川ゲームスの安田善巳、社長に『DARK SOULS』の宮崎英高

  10. ゲームコントローラーの市場規模、2027年に29億7350万米ドル到達予測─技術的進歩や新型コロナの影響で

アクセスランキングをもっと見る