研究の最近のブログ記事

今日はもういい加減頭に来ました!只でさえこんな修論提出前にストレスを溜めたくないのによりによってなんでそんな問題が起きるのか。これは今の研究を始めて幾度となく思ったことだけど、最後の最後まで付きまとってくるとか絶対嫌です。

詳細を書いても後で見て嫌になるだけなんで書きませんが、アルバイトというからには選択権はあるはず、ということだけ。めちゃめちゃストレス溜まったんで頑張って冷静になれるよう努めます。でも、またこれで研究がこじれるんだろうな~。

意思の疎通を図るのはかくも難しいものなのですね(>Д<;)

提案手法の実験結果を評価する指標として、再現率精度、あとF値などがよく用いられます。他のWebページなどを参照すればすぐに分かる内容なのですが、自分自身のためのメモとして残しておきます。


まず、これらの指標が何かを示す前に、背景を少し説明しておきます。まず、あるデータベースから正解データをいかに正確にたくさん発見できるかという問題があり、それに対して提案手法はどの程度有用であるかを実験によって評価します。

ある手法では、与えられたデータセット全てを正解データであると認識したとします。この場合、確かにデータセットに含まれる正解セットの全てを発見したと言えるでしょう。しかし、それ以上に正解でないデータも正解としてしまっています。これでは、この手法は現実には役には立たないでしょう。

また、ある手法では、与えられたデータセットのほんの少しだけを正解データであると認識したとします。この場合、当たり外れはあるものの、当たれば正解と認識したデータ全てがその通りである可能性は高いと言えます。しかし、他にも存在するかもしれない正解データを認識することはできず、これもまた現実には役には立ちません。


ここで再現率(recall)とは、全ての正解データのうち、どれだけ正解であると認識したか示す割合です。上記の2つの手法をこれで比較すると、前者は再現率が限りなく1に近いのに対し、後者はほとんど0に近くなります。

また、精度(precision) *1 とは、正解であると認識したデータのうち、本当に正解であるかを示す割合です。前者の手法では、精度はあまり良くない(0に近い)のに対して、後者の手法では1か0に近い値を示します。精度はよく適合率とも呼ばれます。

さらに、再現率と精度の調和平均(逆数の相加平均をさらに逆数にしたもの)を計算することで、F値(F-measure)を求めることができます。多くの場合、F値が高ければ有用な手法であると言えます。

再現率と精度を示したベン図

Aは正解と認識したデータ、Bは正解データ、Cは認識された正解データ。

再現率=C/B、精度=C/A

*1 : 適合率とも言います。

Advertizement

このアーカイブについて

このページには、過去に書かれたブログ記事のうち研究カテゴリに属しているものが含まれています。

前のカテゴリは日記です。

次のカテゴリは雑記です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

Powered by Movable Type 5.0

最近のコメント

kaneko on PowerPoint Viewer 2007が起動しない時の対処法: この情報を見て本当に
hszaki on ハワイアン・バーガー: 残念・・
alto on ハワイアン・バーガー: 食べたその日にこの記
tetsu on ハワイアン・バーガー: マヨネーズは・・・、
hszaki on ハワイアン・バーガー: マヨネーズ入っていた
tetsu on MovableType5にアップグレード: 指摘ありがとうござい
hszaki on MovableType5にアップグレード: 新年早々、エリクサー
tetsu on FFXIII: win2000って.
alto on FFXIII: こっちでも仕事でちょ
tetsu on 所属オケの演奏会: ごめんなさい^^;

カウンタ

リンク