盆暗の学習記録

データサイエンス ,エンジニアリング,ビジネスについて日々学んだことの備忘録としていく予定です。初心者であり独学なので内容には誤りが含まれる可能性が大いにあります。

『データ分析と意思決定理論』を読んだ

『データ分析と意思決定理論』を読みました。

この本は経済学者が書いた一般向け(非専門家向け)の本で、第1部がデータ分析、第2部が意思決定理論という構成になっています。

要点や印象的だった点などをメモしておきます。

第1部(データ分析)について

世の中のさまざまな分析・推論は信頼できない仮定に基づいている

  • 基本的に、分析で強い結論を得るためには強い仮定を置いて分析する必要がある
  • 多くの人は点推定のように強い結論を好むため、世の中の様々な分析は分析者の強い仮定の下で行われている
  • 仮定の置き方によって導かれる結論が変わることはよくあることなので(本書中で時々引用されるManskiの研究でもそういうものは少なくない)、どういう仮定を置いた分析なのかに注意する必要がある

RCTも仮定の下での分析

  • ランダム化比較試験(RCT)も(経済学にとっては)強い仮定の下の分析である
  • RCTには、「処置に対する反応は個人だけで、他のメンバーに影響を与えあうような社会的相互作用(social interaction)がない」とする仮定がある。
    • 例えば「職業訓練プログラム」を処置として扱うなら処置によって労働市場の状態が変わってしまうので仮定が満たされない
  • 実際のRCTはゴールドスタンダードと呼ばれるほどの理想とは程遠い。しかし、信頼できる区間予測を作ることはできる。

部分識別

  • 部分識別(partial identification)は効果の推定を点ではなく区間で行い、仮定を置かない状態から徐々に仮定を追加していって分析する。

f:id:nigimitama:20211226161905p:plain

f:id:nigimitama:20211226161911p:plain

(出所:奥村(2015)「部分識別とその応用: 処置効果を中心に」

第2部(意思決定理論)について

意思決定理論とは

  • 意思決定の価値(効用や厚生とよぶ)が部分的にしかわからない状況下で、意思決定者がどう振る舞うのが妥当なのかを考える分野。
    • もし厚生がすべて既知なら単にそれを最大化するようにすればよいので、不確実性が前提

用語

  • 意思決定の結果は、選択した行動と環境特性によって決まると定式化する。この環境の特性を自然状態と呼ぶ。
  • 意思決定者が起こりうると考える自然状態をすべて網羅するリストは状態空間と呼ばれ、部分的な知識を表す。
  • 行動選択から生じる結果の厚生を、行動C、自然状態sからW(C, s)と表す。これを厚生関数という。状態空間は意思決定者のもつ知識(情報)を表すのに対し、厚生関数は意思決定者の選好を表す。

意思決定基準

(1) 「支配される行動」を消去する

  • 行動CとDがあるとし、すべての自然状態のもとで W(C, s) ≧ W(D,s) のとき、DはCに支配される行動だと言われる。支配される行動は選ぶべきではない。

(2) 支配される行動以外の行動の選択肢が複数個残った場合:

  • 期待厚生基準:各自然状態が発生すると考える信念の強さ(意思決定者の主観確率)で重み付けして加重和(期待値)を計算し、その厚生の期待値が最も高くなる行動を選択するという基準。
  • マキシミン基準(maximin criterion):行動が生み出す厚生の最小値(各行動の最悪ケース)でその行動を評価し、その厚生の最小値のなかで最も大きい厚生を生む行動を選択する。
  • ミニマックス・リグレット基準(minimax regret criterion):リグレットとは各自然状態の下での最高と最悪の結果の差。起こりうるすべての自然状態にわたってその行動が生み出すリグレットの最大値を求め、その値でその行動を評価する。
  • (※常にこれを選べばいい、みたいな最高の基準はないので妥当な基準を選ぶ必要がある)

適応的分散:処置を順次施していく場合

  • いくつかの時点に分けて意思決定できる場合、対象の集団をいくつかのグループ(コホート)に分けて順次処置を施していき、前のコホートの結果に応じて後のコホートの意思決定の参考にすることができる
    • 適応的ミニマックス・リグレット(Adaptive Minimax Regret: AMR)基準:プランナーは処置の時点でわかっている処置反応のデータを使って、各コーホートミニマックス・リグレット基準を適用する。

集団による意思決定

  • 意思決定者が複数人からなり、個々人で意思決定基準が異なる場合はどうなるのか
  • 投票で意思決定する場合は社会選択理論の話になっていく(どういう選好を持つ人々がいるのかの前提によって結果は変わる。特定の前提の下での理論は例えばアローの不可能性定理、ブラックの中位投票者定理などがある)
  • 議会内での投票など、戦略的相互作用が存在する場合は、自分の選好通りに投票しないことが有利になることがあり得る
  • 投票ではなく二者間の交渉の場合、エッジワースボックスのパレート最適な配分に落ち着くことが考えられる

感想

  • 読んでいくなかで、Manskiは分析の仮定に非常に注意を払っている方だなというのが感じられて、科学者の態度として勉強になりました。
  • 部分識別の「仮定を置かない状態から徐々に強めていく」というアプローチは非常に良いと感じました。

  • 意思決定についてはバンディット問題みたいな感じもあり興味深いですね。

    • ただ、個人ならまだしも集団の意思決定となると参加者の選好も未知ですしなかなか複雑で分析も難しそうなチャレンジングな感じですね。
  • 一般向けの本ということで全体的に広く浅く書かれた本ですが、各分野に興味を持つきっかけになるという分にはいい本かなと思います。
    • 一つ文句をいうとすれば、この本は何故か縦書きになっていまして、縦書きに書かれた数式が読みにくくて仕方ありませんでした…