How many samples are needed to build a classifier: a general sequential approach.
Bioinformatics 2005 Jan 1;21(1):63-70
癌種鑑別などを目的とした(Gene Expression を使った)解析にはサンプルがどのくらい必要なのかを,測定を進めながら判断しようという話.事前にサンプル数の見積もりができればそれに越したことは無いのだが現実には難しいので,測定を進めながら「もう充分かな?」と思ってよいのかどうかを判断するのが現実的であるというのが裏に流れる思想.現実的な要請にこたえるものでもあるし着眼点は良いと思ったがいわゆる day effect みたいなもの,例えば試薬のロット差・経時劣化やサンプル調整をおこなう人間・およびその調子など,が無いと仮定するのはどうなんだろうか? 現実的にはパイロットスタディー ⇒ サンプル数の見積もり ⇒ サンプル収集 ⇒ 一気に測定 ってのが一番質の高いデータを得る方法のように思える.