Semantic SegmentationとFCNを解説！ - 山下誠二郎のITとフォートナイトと野球ブログ

Semantic Segmentationとは

今までの画像認識では画像を学習して、ラベル名を推測するといったケースが一般的でした。
Semantic Segmentationでも技術としては間違いでは無いのですが、
Semantic Segmentationは画像内の全画素においてラベル分類することが可能です。

実際に全画素においてラベル分類できるとどうなるのか？

以下のサイトのような感じ

lionbridge.ai

画像に写る物体が何なのかを可視化してくれます。

畳み込みニューラルネットワーク（Convolutional Neural Network）

まずは復習がてらに一般的に画像認識で適用されるCNNについて。

畳み込み層

畳み込み層では、入力画像をフィルタを用いて、畳み込み演算をします。
様々な特徴をまとめたフィルタ群を形成しており、
入力画像とフィルタで畳み込み計算を行い、特徴マップとして出力されます。
特徴マップではフィルタと画像の部分領域に共通した特徴が見られると、
高い値となり、画像の特徴量として抽出できるのです。

畳み込み層ではフィルタが重みパラメータとしての最適化され、
前記事で述べた誤差逆伝播法によりフィルタの誤差勾配が計算されています。