人の様に世界を理解するコンピュータを目指して

人間は画像，映像，音声，文字など様々な情報から柔軟に世界を理解していますが，コンピュータに同じことをさせるのは簡単ではありません．本研究室では，コンピュータをより知的に進化させることを目指して，コンピュータビジョン，メディア情報処理，パターン認識，機械学習，深層学習等に関する研究を行っています．

絞り込み

手書き文字生成

少数の手書き文字でfine-tuningすることで手書き文字生成モデルを作成します．

単眼カメラ映像のみを使用した野球スイングの分析

ボールとバットの検出，打者の骨格推定を駆使してスイングの分析を行います．

人物・アイテムに着目したパフォーマンス評価

動画からパフォーマンスの優劣を数値的に予測することで，パフォーマンスの良し悪しを判定します．

人物イラストの領域分割

実画像データセットをイラストにスタイル変換して，学習を行います．

飲食店における空きコップ・空き皿検出

監視カメラの映像から深層学習を用いて空きコップ・空き皿を検出します．

自動二輪のための路上危険物検出

路上のスリップしやすいマンホールの蓋を遠い距離から検知します

映像による視線推定とその応用

深層学習を用いた虹彩中心の検出と眼球位置の推定による高精度な視線推定を行います．遠方に小さく映る人物でも高精度の推定を可能とします．

バスケット選手のプレイ解析のためのボール追跡

サッカー放送映像からの特定選手追跡

深層学習技術と粒子フィルタを組み合わせて団体競技の選手を追跡します．

手指動作認識による仮想キーボード

紙の鍵盤上で楽しめる簡易楽器を実現します．設置場所を選ばず，また実際のピアノでは不可能な演奏を可能にします．

漫画タイトルの識別

漫画のタイトルを推定します

トレーディングゲームカードの実時間認識

画像上のカードを実時間で認識します．様々な角度で撮影されるカードの傾きにも対応し，撮影環境に左右されないカード認識を実現します．

映像による受講生の挙動解析

カメラで撮影した受講生の動きから受講態度を分類します.

深層学習によるマスク除去

マスクを付けた顔画像をマスク無しの自然な顔画像に変換します

映り込みの人影除去

写したい人はそのままに残し、背景などに写りこんだ人影のみ除去します

屋外風景写真からの不要人物消去

深層学習による画像生成技術を用いて，風景の記念写真から不要な人影を消去します．

線画アニメの自動着色

一つの着色済みフレームから後続の線画フレームに対し自動着色を行います．

深層学習による漫画キャラクタの自動着色

ペンやスクリーントーンで作成された漫画画像を入力とし，自動でカラー着色を行う研究です．入力した漫画画像をキャラクタごとに領域分割(判別)し，それぞれのキャラクタに合わせた着色を実現します．

イラストにおける服のシワ生成

イラストにおける服のシワとその影を深層学習を用いて自動生成します．

仮想試着のための着衣除去による自然な画像の生成

深層学習に基づく身体部位の3D推定と，肌の露出部分の色を活用した着衣除去を行います．

樹木イラストの自動生成

再帰的描画により樹木を表現し生成します．エネルギーモデルにより成長度合を制御し，密度を考慮することで枝葉の重なりを制御します．枝先の回転等，現実の樹木には有り得ない形状を表現することができます．