名古屋大学出版会、2020年。なーるほど、これはおもしろい。あれこれの手法を備えた統計学に感じる、もやもや感を整理して説明してくれる。もともとが講義だそうで、僕は知らない統計の手法も出てくるが、全体としては読みやすい。終章がすっきりとした全体の要約になっている。

序 章 統計学を哲学する?
第1章 現代統計学のパラダイム
 1 記述統計
 2 推測統計
第2章 ベイズ統計
 1 ベイズ統計の意味論
 2 ベイズ推定
 3 ベイズ統計の哲学的側面
第3章 古典統計
 1 頻度主義の意味論
 2 検定の考え方
 3 古典統計の哲学的側面
第4章 モデル選択と深層学習
 1 最尤法とモデル適合
 2 モデル選択
 3 深層学習
 4 深層学習の哲学的含意
第5章 因果推論
 1 規則説と回帰分析
 2 反事実条件アプローチ
 3 構造的因果モデル
 4 統計的因果推論の哲学的含意
終 章 統計学の存在論・意味論・認識論
 1 統計学の存在論
 2 統計学の意味論
 3 統計学の認識論
 4 結びにかえて

統計学の存在論として。「統計学の概念の多くは、何らかの量や関数として定義される。しかし1章や5章で見てきたように、それらが皆同じ存在論的身分を持つのではない。いわば概念によって、「住む世界」が違うのである。例えば標本や統計量などは、データの世界に住む概念である。一方で、期待値、確率分布や分布族のパラメータ、回帰モデルの係数などは、確率モデルの世界を記述するものだ。そして最後に、平均処置効果や構造方程式の係数は、因果モデルに属し、可能世界間の関係性を表す。・・・・・・この意味で、統計学とは、こうして区分された存在の層を乗り越えていこうとする試み、またそれが可能であるための条件を特定しようとする試みだと言えるだろう」(218-219)。

このまとめの一文を解説するかたちで、自分用の覚え書きを。現代統計学には、与えられたデータを要約する記述統計と、データをもとに未観測の事象を予測・推定する推測統計がある。ヒュームが言うところの自然の斉一性の前提として、推測統計が帰納推論を精緻化して用いるモデルが(筆者が言うところの)「確率モデル」である。それは、確率関数、確率変数、確率分布などに表わされる。
 筆者はまた、この「確率モデル」とは区別して、「統計モデル」という見方を示す。「統計モデル」とは、はじめから近似的なモデルとして立てられるもので、「分布族」と呼ばれる具体的な関数としては一様分布、ベルヌーイ分布、二項分布、正規分布などがその代表例である。統計モデルは、確率モデルの前提の上に用いられる。〔確率モデルは世界のあり方に関する措定であり前提であるのに対して、統計モデルはより具体的な道具的存在であって、その意味では両者をともに「モデル」と括るのはちょっと分かりにくい気もする。〕「分布族」は、データの規則性を説明するための措定として、生物学における自然種と同じ働きを果たしており、したがって「確率種」と名づけうると筆者は主張する。
 確率種の想定は、予測だけをするものであって、因果を定義することはない。それは、因果関係を確率的関係に還元するものである(したがって、それは本来「集まり」に対してのみ確率を付すことができるのであり、単一事象への適応は派生的ないし逸脱的である。95-96)。しかし、介入を行う上でその結果予想や制御を問題にするのであれば、確率モデルの上に「因果モデル」を置く因果推論が求められる。そのときに因果関係をつきとめる発想は、「もしXでなかったら」という現実世界と可能世界の差分を問題にするかたちを採る。ここでの因果とは、確率に還元されるものではなく、確率モデルのさらに向こうにある可能世界に属する概念である。無作為化比較試験(RCT)も、因果を現実世界と可能成果の差分として捉える点で共通するが、RCTは実際に実験として可能世界を実現化させて比較を行う。これに対して、実験ではなく推論を行うのが因果推論であり、その手法としてはルービンの反実仮想モデルが知られている。因果モデルは、確率モデルともちがった、可能世界の想定であって、個別の想定は「確率種」に対して「因果種」と呼ぶべきものとなる。

そのほかにも、二点ほど論点まとめ。

ベイズ主義と古典統計について。信念間の論理的整合性から蓋然的推論の正当化を得るベイズ主義は内在主義的正当化であり、古典統計の頻度主義は外在主義的正当化である。頻度主義は「集まり」に対して確率を付すものであって、そこでは「仮説の確率」という概念はそもそも意味を持たない。ベイズ主義の主観主義は、仮説に確率値を割り当てることができるが、「しかしそれはあくまで個々の認識主体の信念の度合いとしてであり、仮説の正しさを客観的に表す数値としてではない」(223)。正当化自体の発想が異なるベイズ主義と古典統計を、「手法としての有効性」のような同一地平に並べて比べることは無益であることの構造的(意味論的?)理由を明示した点は、本書のもっとも大きな理論的貢献になりうる。

深層学習とそれに根ざしたAIについて。それは真理から予測へのシフトを促すものである。つまり、それが現実世界の模写ではなく、有用性を主眼とするものであって、プラグマティズム認識論に通じるものである。

ひとつ安心したのは、古典統計にしても、また回帰分析のような統計的因果推論にしても、それはあくまでひとつの帰納的推論であり、どんな手法を採ろうとも、結局「検定はアプリオリに想定された因果関係を用いて結果から原因を推論するのみであって、その因果関係自体を推論するわけではないのである」(191)ということを確認させてくれたこと。まあ、当たり前なんだけど、こちらは統計の素人だから心配で。どんな変数を立て、共変量を特定しようとしたところで、僕の言い方で言えば、最初にデータを採ること自体が、統計学的には検証不可能な仮説を立てることなわけで。ただ、これがたんに統計学の欠陥や浅薄さなのではなくて、ヒューム以来、哲学長年取り組みかつ解決できずにきている根本問題の表現なんだということを、本書は教えてくれる。

[J0114/201218]