ふぎのモノづくりにっき

痛車乗りのモノづくり日記。いろいろ試したり、作ったりするのを載せる予定だぞいッ

パターン認識のお勉強(はじパタ第3章メモ~ベイズの識別規則~)

にゃんぱすー\(^Δ^)
前回に引き続き、

「はじめてのパターン認識、 平井 有川 著」

の続きをところどころ

  • イメージ化
  • 自分の身近なものへの置き換え、意訳・自分の解釈、関連内容引用
  • 箇条書き化

して、自分用お勉強メモとして記録。
 間違いがあったらすみません、では、はじパタ第3章~ベイズの識別規則~へ!

メモ

○同じ入力Xであっても、毎度出力がYなわけではない。入出力に相関関係はあるが、確率的に結果Yが決まる問題をこの節では扱う。


 ベイズの定理関連のイメージを↓に示す。p,Pは確率とする。

f:id:nyanpasuAxela:20181016194106p:plain

↑最終的には観測データxがクラスCiである確率(事後確率)が最大となるクラスCiが求めたい。
 事後確率P(Ci|x)を直接出せないから、尤度P(x|Ci)から間接的に求める。

 

 本文中の例では、クラスが分かったデータを用いて下記の手順で事後確率を求めている。事前確率P(Ci)と各要素の尤度P(xk|Ci)はデータから直接算出しているが、その他はこの2種データを元に計算している。

 

①事前確率P(Ci)の計算
 ↓
②尤度P(x|Ci)の計算(入力xはベクトルだが、各要素独立としてP(x|Ci)=P(x1|Ci)×P(x2|Ci)としている)
 ↓
③同時確率p(Ci,x) = P(x|Ci)×P(Ci)の計算
 ↓
④周辺確率p(x)=sum[p(Ci,x)]の計算
 ↓
⑤事後確率P(Ci|x)=p(x|Ci)×P(Ci)/p(x)の計算
 ↓
⑥事後確率が最大となるクラスCiに入力xを分類。


尤度比p(x|Ci) / p(x|Cj)閾値より大きいか小さいかでクラス識別するようにもベイズの識別規則は書き変えられる。

条件付きベイズ誤り率・・・2クラス分類にてε(x) = min[P(C1|x), P(C2|x)] ←ベイズで間違える確率

ベイズ誤り率・・・条件付きベイズ誤り率の期待値

↓にベイズの識別規則、誤り率関連のイメージを記す。

 

f:id:nyanpasuAxela:20181016194255p:plain

 

損失L_ijを導入することで誤った時の危険性を考慮(重みづけ)して、クラス識別することが可能。

損失L_ij・・・本当はクラスCjであるものをCiと識別してしまった時の損失。行列。

クラスCiと識別した時の損失r(Ci|x) =sum [L_ik × P(Ck|x)] 各損失×確率の和

損失rが最小になるクラスに識別

ベイズ誤り率で識別性能評価可能⇔事前確率、尤度、識別境界情報必要。

ROC曲線・・・偽陽性率[ε2](本当は陰性なのに陽性と識別する確率)と
        真陽性率[1-ε1](本当は陽性で陽性と識別する確率)を
        横軸、縦軸に取ったグラフ。ROC曲線を使って性能評価可能


↓にROC曲線関連のイメージを示す。   

f:id:nyanpasuAxela:20181016194417p:plain



 

 

 

はじパタ勉強のメモ書きとして書いてましたが、本について細かく書きすぎな気がしてきたので、章ごとに書くのは一旦中止します。