勝虫日記

動物生理学者の覚書

赤池弘次氏の「応用数理」の三本の論文

赤池弘次氏が「応用数理」という学術誌に書かれた三本の論文へのリンクと、一部引用、筆者の覚書をつけ加えました。以下に挙げたものだけではなく、はっとするような磨かかれた言葉がたくさん書かれています。また、統計学を学びはじめてしばらくしてその意味が心に染み込んでくるようになってきました。

 

統計的思考と応用数理 ー 前提となるモデル化の技

1999 年 9 巻 1 号 p. 66-68

https://doi.org/10.11540/bjsiam.9.1_66

 

応用と言う以上、そこには数理の外に実在する対象の存在が前提される。対象についての適切なモデル化がなくては、数理の適用は不可能である。このモデル化には対象についての体感的な深い理解に基づく「技」が求められる。モデル化の技との結び付きが無くては、応用数理の展開はありえない。

ここで言われる「適切なモデル」の適切さを予測の観点で測る指標のひとつがAIC。「数理の外に実在する対象」からの実データをいかに取得するか、そしてそれを深く理解し、さらにいかにモデル化するか、その技が必要であるというわけだ。これらはこの順番でただ一回のプロセスというわけではなく、モデル化することで理解も深まり、さらにデータ取得法を工夫し、また、モデル化するというような循環的なものである。

 

統計的思考と応用数理 ー 形式的な確率的構造の利用

1999 年 9 巻 2 号 p. 169-171

https://doi.org/10.11540/bjsiam.9.2_169 

統計的な方法について書かれた書物を見ると、データにある種の方法を適用することによって意味のある数値が得られる、という印象を受ける。少なくとも筆者が統計的方法について初めて学んだ頃はそうであった。(データ)+(方法)=(意味)、何となく魔術風の感じがするのである。‪

実データというのはそれを見る側に「眼」がなければ、それはただそこにあるだけのもの(=自然)にすぎない。そこにモデル化、模倣などの方法が伴って意味が生じる。そこに客観性がないとたしかに「魔術風」に感じるところがあるが、では自由に選んだ方法についてそれの結果をどのように客観的に評価すればよいだろうか。

 

統計的思考と応用数理 ー 偏見との闘い

1999 年 9 巻 3 号 p. 260-262

https://doi.org/10.11540/bjsiam.9.3_260

パラメータの評価値としての尤度の有効性を示したのが R. A. Fisher の推定理論である。しかし、最尤推定値 θ* に対する最大尤度 p(x|θ*) は、対応するモデル自体の評価値としては使えない。その例が次数選択の最小残差自乗和 S(K) で、観測値に正規分布を想定すれば、最大尤度の対数に (-2) を乗じたものが定数部分を除いて log S(K) に一致する。この関係の認識は直ちに因子数決定問題の解に導く。十分な観測データが得られる場合、対数尤度 log p(x|θ) の最尤推定値 θ* の近傍での動きを近似する二次曲面が、E log (p(x|θ) の θ の真値 θ_0 (モデルが真であるとして、真の構造を与える値、E はこの構造に関する期待値)の近傍での動きの近似を与えることに注目すると、AIC = (-2) 最大対数尤度 + 2(パラメータ数) で定義される量が、最尤推定値の与えるモデルの評価値となることが分かる。

私の中にだけ生じた「意味」には 客観性はない。それを実データに問うことで他人の中にも生じる「意味」に到達する客観性が生れる。このAICは、無限にある選択肢の中から私がつくったモデルと、他人がつくったモデルを実データによって評価させるということを可能にする。より正確には、予測分布を構成して、その予測分布とデータを発生した真の分布との違いを定量化した汎化誤差をAICによって推測する。ただし、これは上にあるように最尤推定が適切に使える条件(統計的正則条件)が成り立つという前提があるということに注意する必要がある。そして現代、よく用いられるモデルのほとんどが実はこの前提が成立しない。