You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
1 Department of Computer and Information Science, University of Macau, Macau, China 2 School of Computer Science, Xi’an University of Technology, Xi’an, China
INFO
author
Xiaodong Cun,1 Chi-Man Pun,1∗ Cheng Shi1,2
affiliation
1 Department of Computer and Information Science, University of Macau, Macau, China
2 School of Computer Science, Xi’an University of Technology, Xi’an, China
conference or year
AAAI2020
link
arXiv
実装
概要
影の除去は, シーン理解のために必要不可欠なタスクである. (例えば, 物体の検出や追跡など, 多くのコンピュータビジョンタスクの性能を低下させる可能性がある. )多くの研究では, 画像内容のマッチングのみを考慮しているため, 影の領域での色の不一致や, 影の境界でのartifactsなどの二種類のghostが発生することが多い.
この研究では以下の2つの方法でこれらの課題に取り組んでいる.
実験により提案手法が実際のデータセットと、合成されたデータセットにおいて既存のSoTAモデルお大きく上回ったことを示した.
既存の深層学習に基づく手法において、大きく2つの欠点がある.
shadow removalのgoalは影の画像から色を復元することであるが, 影の境界もvisual qualityにおいて重要な役割を持つ.
提案手法
shadow imageとshadow-free imageは同じsemantic情報を共有しているため, 影の除去においてshadow imageだけを学習するだけで良いという観察に基づいて新たなネットワークを提案.
context aggregation network(CAN)[Chen, Xu, and Koltun2017]をベースにしている. このネットワーク構造はnonlocal dehazingやL0スムージングなどに適していることがわかっている. このネットワーク構造では, ダウンサンプリングを行わないため, 低レベルの詳細部が保存される. shadow removalは低レベルのタスクに似ているが影の領域を学習する必要があるので, Partial convやGated convを使うという解決策が可能性としてあるが, これらはinpaintingのために設計されている. なので影を特別に学習し, 低レベルの詳細部を保持するために, 階層的なレイヤーを集約するように, 複数前のレイヤーから特徴をagregationしてattention module を構築した. 特徴をツリー状の構造に統合. 図はかなり簡略化されているので式(1), (2)を参照した方が理解しやすい.
Squeeze-and-excitation block (Hu, Shen, and Sun 2018) to re-weight the importance of each feature channel.
loss functions
perceptual loss
BCE loss
GAN loss
Shadow Matting
既存のデータセットは100以上の異なるシーンと10以上のユニークな影の種類しか含まれていない. また, 環境光は非常に早く変化するので, フラッシュでも同じ光の状態で影がある/影のないペアを撮影することは不可能である. shadow/shadow-free image間で変換される光の不確実性は, ネットワークの精度に影響を与える. これらの影響より, 限られたシーンでの訓練はshadow/shadow-freeの領域で色の不一致が発生する. そこでGANを介してshadow-freeな画像を合成し, データセットを作成.
pix2pixと同じようにペア画像として訓練, SMGANの構造はCycleGANを同じ. 実験の結果このような設定は, 影の除去と検出のタスクに十分であることがわかった.
検証
Removal
定性評価
ISTD, ISTDの合成画像で学習させ, SRDで評価. 合成画像を含めた方がうまくいっている.
定量評価
(S) は影の領域における評価, (NS)はnon-shadowの領域における評価
Ablation Study
Detection
定性評価
影の検出だけで学習させた場合.
定量評価
back-boneで良いのを試せば精度が上がる可能性がある.
影の合成の評価
Attention
新規性
議論,展望
Comment
既存手法だと新たにBlenderなど使って新しい影を合成したデータセットを用いるなどはよく見かけた.
影を合成してデータセットを作成することを考えた際に, そもそものデータに依存してしまうのでは.. と思っていたがどうやら有効らしい. GANでのaugmentationが有効な例と考えることができる (?)
実際Colabでコードを動かしてみたが, やはりデータセットのドメイン外だとうまくいかないことが多そう. ドメインギャップにどう対応するかが今後の課題になりそう. 他にも, 例として階段などに影が落ちている場合などの影の除去は難しそう.
ゲーム内での合成を確認してみる. ↓
Sidorov (2019), Conditional gans for multi-illuminant color constancy: Revolution or yet another approach?
date
May 19th, 2021
The text was updated successfully, but these errors were encountered: