異常検知
正常な線虫の胚がどのように細胞分裂が進むかを顕微鏡で観察した「正常データ」と、線虫の1遺伝子の機能を著しく低下させた線虫の胚を撮影した「異常データ」で、どのような違いがあるかを計算機で自動的に検知し、定量的に比較することは、遺伝子の機能を推定する上で重要です。そこで、異常検知に関して、以下の2種類のアプローチに取り組んでいます。
1つめのアプローチは、深層学習の技術を用いた異常検知の研究です。異常データのすべてのバリエーションを把握し教師あり学習することは難しいため、正常データを AutoEncoder などニューラルネットワークのモデルで教師なし学習するアプローチが一般的です。正常データを学習したモデルに異常データを与え、再現できない部分を異常部位として検出します。しかし、AutoEncoder は、汎化性能が高すぎる性質があり、生物画像の異常検知に用いると、異常データも再現してしまい異常が検出できない問題があります。そのため、AutoEncoderの派生モデルであるMenAEの利用をはじめ、画像中の着目したい部分に注目したり、細胞の形状の異常や時間の異常を区別するモデルの構築に取り組んでいます。
2つめは、確率モデルの技術である隠れマルコフモデル(HMM)などを使用した異常検知の研究です。音声認識で用いられてきた技法です。時系列データをモデルに与え時系列データのパターンを認識し、異常検知をするために、HDP-HSMMと呼ばれるモデルの応用を試みています。こちらでは画像を直接与えるよりも、高い精度で異常検知することを目指します。