盆暗の学習記録

データサイエンスを中心として,日々学んだことの備忘録としていく予定です。初心者であり独学なので内容には誤りが含まれる可能性が大いにあります。

メモ系アプリ類の比較(Evernote, Dropbox Paper, Typoraなど)

普段のメモをどうやって残すか,ということについて頭を悩ませています。

私のニーズとして

  1. Markdownで記述できる
  2. TeXで数式を記述できる
  3. 簡単に画像を挿入できる(クリップボードから貼り付けなど)
  4. 複数の端末からアクセスできる(スマホやPCなど)

があるのですが,これらをすべて満たすツールになかなか出会えていません。

最近,EvernoteDropbox Paper,それからMarkdownエディタのTyporaを試したので,今回はそれらの長短をまとめてみます。

ついでに,私が今まで使ってきたツールも載せていきます。

今まで使ってきたツール

はてなブログ

はてなブログもいいメモ帳になるんじゃないかと思っていた時期が僕にもありました…

  1. Markdown → △
    • 基本的に使えるが,仕様上Tabキーが使えないのでリストのインデント(段落)をつけるためにタブ1回=スペース4回換算で何十回もスペースを連打する羽目になり使いにくい
  2. TeX → △
    • 要求されるTeXの記法が独特であり正直使い物にならない
  3. 簡単に画像を挿入できる → ○
  4. 複数の端末からアクセスできる → ○

Markdown

Markdown(.md)をAtomで扱うこともありました。

数式や画像を乗せる必要がなければこれで足りますが,それらが必要なときは困ります。

  1. Markdown → ○
  2. TeX → ✕
  3. 簡単に画像を挿入できる → ✕
  4. 複数の端末からアクセスできる → ✕

Rmarkdown

私はメモにRmarkdownを使うことも多いのですが,これは画像をクリップボードから貼り付けできなかったり,日本語入力が不得手であったりと,問題も少しあります。

  1. Markdown → ○
  2. TeX → ○
  3. 簡単に画像を挿入できる → ✕
  4. 複数の端末からアクセスできる → ✕

最近試したツール

Evernote(本家)

メモ帳ツールが本業なのもあって基本的にクオリティが高いです。 しかし,私のニーズは満たしませんでした。

  1. Markdown → △
  2. TeX → ✕
  3. 簡単に画像を挿入できる → ○
  4. 複数の端末からアクセスできる → ○

サクサク気軽にメモできる点と,手書きメモなどにも対応する高機能な点から,今後も使っていこうとは思います。

Evernote + Marxico

MarxicoはGoogle Chromeのアプリで,MarxicoのエディタでMarkdownを書くとEvernoteが認識してくれる形に変換してEvernoteに保存してくれます。

詳細はこの記事などが良さそうです: https://nelog.jp/marxiconelog.jp

  1. Markdown → ○
  2. TeX → ○
  3. 簡単に画像を挿入できる → ○
  4. 複数の端末からアクセスできる → △

MarkdownTeXも使うことができて,画像も貼り付けができて素晴らしいです。

f:id:nigimitama:20180617211546p:plain

しかし, - TeXで書いた数式は画像として記録される - Googleアカウントの連携アカウントだと,Marxicoと連携できなかった
 → 私の普段使いのアカウント(Googleアカウント)はMarxicoでは使えなかった - Google Chromeアプリという形態 - 私は普段Google Chromeはあまり使わない - パソコンからでなければ編集できない

といった点は少し残念でした。

Dropbox Paper

Dropboxのメモ機能です。複数人での共同作業用に作られていて,普通のメモ帳ツールとは目的が異なっていますが,メモ帳としてもそこそこ優秀です。

qiita.com

しかし,Markdownの見出しがレベル3(###)までしか対応していなかったり,TeX記法の数式が書けなかったり,使いにくい部分も…。

f:id:nigimitama:20180617214720p:plain

  1. Markdown → ○
  2. TeX → ✕
  3. 簡単に画像を挿入できる → ○
  4. 複数の端末からアクセスできる → ○

Typora

最強のMarkdownエディタらしいです。実際,非常に使いやすくできています。

qiita.com

確かにMarkdownエディタの中では最強だと思います。Atomからこっちに切り替えようと思います。

フローチャートガントチャートを描くことができるなど,エンジニア向きの機能が豊富なようで,こうした点も素晴らしいと思います。

f:id:nigimitama:20180617214541p:plain

Draw Diagrams With Markdown

しかしながら,行中のTeXが数式にならないという大きな問題がありました。うーむ…。

f:id:nigimitama:20180617214517p:plain

  1. Markdown → ○
  2. TeX → △
    • 行中のTeXは数式に認識してくれない
  3. 簡単に画像を挿入できる → ○
  4. 複数の端末からアクセスできる → ✕
    • PCのみ,ローカル管理のみ

まとめ

私のニーズをすべて満たすものはありませんでした。誰か作ってください…(私に技術力があれば「いい市場見つけた!」とか言って作るんですが…)

Evernote + Marxico の構成が今の所一番良かったので,しばらくはこれを使うことにします。

追記(2018/7/10)

Typoraで

行中のTeXが数式にならない

と書きましたが,設定を変えれば使えるみたいです!

f:id:nigimitama:20180710185219p:plain

科学史についてのメモ

諸学問について全体的に興味を持っていたため,「科学」を知ることができそうなこの本を買いました。

この本は,序盤に

  • 「科学とはなにか」という問いに答えるには,哲学だけでなく,歴史学社会学も含めた多面的な考察が要求される
  • ゆえに本書では,(1)科学史,(2)科学哲学,(3)科学社会学,の三本を柱とした広い意味での科学論を述べる

といったことが書かれており,実際にこれら(1)~(3)の構成になっているため,ここでのメモも3つに分けていきます。

今回は,科学史について,この本やインターネット上の資料を基にメモしていきます。

1. 古代――アリストテレス的自然観

コスモロジー

(1)古代天文学

古代の天文学理論(セントラル・ドグマ)

  1. 天上と地上の根本的区別
    • エンペドクレスの「四元素説:万物は地(土),水,火,風(空気)から構成される。四元素は「愛」と「憎」によって結合と分離を繰り返し,自然現象を現出させる
    • 月の天球を境にして,天上界と地上界は分かれる。地上界は四元素からなるが,天上界はエーテルという第五元素で形作られている
  2. 天体の動力としての天球の存在
    • 星が回転するのではなく,天球(透明な球殻)が回転し,天球に付着する星も地球の周りを回る
  3. 天体の自然運動としての一様な円運動

f:id:nigimitama:20180602001503p:plain

セントラル・ドグマでは説明できない「変則事象」

  1. 地球と惑星(水星,金星,火星,木星土星,太陽,月)との距離が変化している
  2. 惑星の不規則な運動

古代天文学の難問(アポリア)(上記の2つの問題)への取り組み

  1. エウドクソスの「同心天球説:異なる角度の回転軸を持つ複数個の天球
    • しかし,天球なので「地球と惑星の距離が変化している」ということを説明できない

f:id:nigimitama:20180602001543p:plain

  1. アポロニオス・ヒッパルコスらによる「周転円説」(プトレマイオスの天動説
    • 「離心円(地球から離れたところに軸がある円軌道)」「周転円(地球を中心とする第一次円軌道の円周上の一点を中心とする小円)」「エカント(離心円上の点,惑星はエカントに対して一定の角速度で運動する)」などの概念を導入
    • 惑星の「一様な円運動」というセントラル・ドグマを逸脱することなく惑星の不規則運動を説明できた
    • 当時の観測データとも高い精度で一致しており,非常に合理的な理論だった
    • その後は周転円説の理論の精緻化が進められ,コペルニクスの時代(16世紀)には周転円の数は80個を超えるほど複雑化した
    • 地球から見た惑星の運動が「一様な円運動」というアリストテレス的自然観のドグマを外れたところが唯一の欠点

f:id:nigimitama:20180602001604p:plain

(2) 古代自然学の運動論

  • 自然学の中核は運動論
  • 古代ギリシアの「運動(キネーシス)」とは,石の落下から植物の生長までを含む広範な概念
    • 「可能態(デュナミス)」から「現実態(エネルゲイア)」への移行と捉えられた
    • 例えば,種子(可能態)が樹木(現実態)になる,というように,可能性の実現として考える

古代運動論のセントラル・ドグマ

  1. 自然運動の原因は自然的傾向

    • アルケー(根源物質)である四元素(地・水・火・風)は本来あるべき「自然な場所(natural place)」があり,そこに向かう自然的傾向がある
      • 地上界の中で,上から火>風>水>地の順になっている。火が月の天球近くで,地は地球の中心
      • 地上の物体の自然運動は,自然な場所に戻ろうとする「自然的傾向」によって生ずるものである。物体の自発的運動であり,可能性が現実化される過程である。
  2. 強制運動の原因(外部からの力)は接触による近接作用(押す・引く)

  3. 物体の速度は動力に比例し,媒質の抵抗に反比例する

    • 重さの違う物体を落下させた場合,重いほうが外力が強いため,重い物体ほど早くなる

セントラル・ドグマでは説明できない「変則事象」

  1. 投射運動:投射された物体が直接的な接触作用を離れても運動を続ける現象を説明できない

    • この問題への古代運動論の答え
      • プラトンの「まわり押し理論」:投射されたボールは周りの空気を押し分けながら進み,ボールが進んだ後ろの空気は希薄になるため,「自然は真空を嫌う」ことから押し分けられた空気が真空状態になった場所に急激に回り込むため,その動力がボールを更に前へ進める。(空気が直接的な近接作用を与えるためボールは飛び続ける)
  2. 落体運動の加速度:自由落下において物体の速度が次第に増していく現象

    • アリストテレスによれば,「落体の速度は重さ(動力)に比例する」ため落下速度は一定になるはずだが,現実はそうならない
    • この問題への古代運動論の答え:
      1. 物体が落下するにつれて,それに抵抗する空気の層が薄くなるのだから,抵抗が減少するにつれて落下速度が増加する。
      2. 故郷に近づくと足取りが軽くなるように,物体も自分の自然な場所が近づくにつれて,自然的傾向が強まって速度を増す。

2. 中世――古代知識の断絶と復活

3. 近世――科学革命

  • 科学革命はコペルニクスの『天球回転論』(1543年)~ニュートンの『自然哲学の数学的諸原理(プリンキピア)』(1687年)の約150年間

科学革命(1) 天文学

  • 古代の天文学理論(セントラル・ドグマ)(再掲)
    1. 天上と地上の区別
    2. 天球の存在
    3. 一様な円運動

コペルニクス

  • プトレマイオスの天動説の体系は3の「一様な円運動」を捨てている
  • コペルニクスは,宇宙の調和的秩序(コスモス)を回復しようとし,古代の天文学理論のうち2と3に忠実であろうとして1を捨てた
    • 伝統的な「一様な円運動」の魔力に深く囚われていたために,「天上と地上の区別」を捨てるという大胆な発想に至り,科学史上稀に見る革新を成し遂げた
    • プトレマイオスの体系では周転円が80個以上になっており計算が複雑だった一方,コペルニクスの説であれば暦作成などの計算が楽になるという実用性の面も,地動説の受容を促進していった

f:id:nigimitama:20180602010205p:plain

ケプラー

  • コペルニクス固執していた「一様な円運動」と「天球の存在」のドグマを打ち破り,近代天文学への道を切り開いたのがヨハネス・ケプラー
  • 「一様な円運動」の否定

    • ケプラーは師のティコ・ブラーエから受け継いだ観測記録から火星の軌道を推定する作業に取り組み,以下の法則を発見した
      • 第1法則(楕円軌道の法則):惑星の軌道は真円ではなく楕円である
      • 第2法則(面積速度一定の法則):惑星と太陽とを結ぶ線分が単位時間に描く面積(面積速度)は、一定である。
        →「円運動の一様性」を否定
      • 第3法則(調和の法則):惑星の公転周期の2乗は、軌道長半径の3乗に比例する。太陽中心説を裏付けるとともに,宇宙の数学的秩序を発見
  • 「天球の存在」の否定

    • ケプラーは新プラトン主義に基づく神秘主義的側面を持っていた
    • 惑星の運動に作用を及ぼす「運動霊(anima motrix)」という概念を考えていた。
      • 運動霊が惑星に与える力は,太陽からの距離に反比例して弱くなるものとされた。
      • 運動霊の概念は,神秘的色彩を無くせば後の万有引力の概念への第一歩と言える概念であった。
    • ギルバートの『磁石論』(1600年)を読んで以降は運動霊の働き(今日における重力概念)を「磁力」によるものと考えていた
      →「天球の存在」の否定
  • ケプラーを契機として,天文学が「天体の幾何学」から「天体の物理学」へ転換していった

科学革命(2) 物理学・運動論と自然の数学化

「宇宙という書物は数学の言葉で書かれている」

  • 中世にピュリダンの「インペトゥス(impetus,勢い)理論」が運動論を前進させたが,インペトゥス理論もアリストテレス存在論を前提としている過渡的理論であり,真の意味で近代力学の礎を築いたのはガリレオである
  • ガリレオは運動論の革新を成し遂げただけでなく,自然観を質的なものから量的なものへと変えた。
    • 「宇宙という書物は数学の言葉で書かれている」というようなことを『偽金鑑識官』(1623年)で述べている。
    • この言葉は近代科学の方法論的マニフェストとでも言うべきもの。

ガリレオの運動論:物体の運動を数量的に定式化

  • ピサの斜塔の実験

    • ガリレオは実際には実験していない(斜塔での話は伝説にすぎない)が,思考実験(背理法による論駁)はしている。
      1. アリストテレスの見解(重いものは速く落下する)を仮定する。
      2. 仮に,重い物体は8の速度で,軽い物体は4の速度で落下するとする。
      3. 重い物体と軽い物体の2つの物体を結びつけて落下させてみる。すると,重い物体は減速され,軽い物体は加速されることによって,結合された物体は8と4の中間の速度で落下するはず。
      4. しかし,結合された物体は8+4=12の重さを持つため,8よりも速く落下しなければならない。ここに矛盾がある。
  • 落体の法則

    • ガリレオは物体の落下に関して,上記の論証だけでなく実験も行い(近代の実験科学の成立),落体の法則を発見した。
    • 第一法則:真空中ではすべての物体は同じ速度で落下する
    • 第二法則:自由落下する物体の落下速度は落下時間に比例し,落下距離は落下時間の二乗に比例する
  • 慣性の法則:すべての物体は外力が働かない限り,静止または等速直線運動を続ける

    • (現実には空気抵抗や摩擦があるため,等速直線運動を続けることはなく最終的には停止する)
      → 古代運動論のドグマ (1)「自然運動の原因は,自然な場所に戻ろうとする自然的傾向によるもの」は無用の概念となった
      物体を「四元素の性質」など「質的」な説明を行う時代から「量的」な説明を行なう時代に転換した
    • 投射運動も慣性の原理と落体の法則で説明できるため,古代運動論のアポリア(未解決だった難問)は解決された

ニュートン『自然哲学の数学的諸原理(プリンキピア)』

  • ニュートンは数学的自然科学の体系を完成させた
  • 『プリンキピア』ではユークリッドの『原論』に倣って,初めに定義と公理を掲げ,そららを基礎命題として定理(命題)を証明していくというスタイルをとっている

    • 基本法則として掲げたのは以下の3点
      • 第 1 法則(慣性の法則):すべての物体は、外力によって強制されない限り、静止の状態、または直線上の一様な運動の状態(等速直線運動)を続ける。
      • 第 2 法則(運動の法則):物体の運動(量)の変化は、作用する力の大きさに比例し、力の向きにおこる。  F = m a(力=慣性質量×加速度)
      • 第 3 法則(作用・反作用の法則):作用には反作用を伴い、2 物体相互の作用は常に大きさが等しく、逆向きである。
  • 第一遍「物体の運動について」の命題11において,「楕円軌道上を回転する物体が楕円の焦点へ向かう求心力(引力)は距離の二乗に反比例する」(逆二乗の法則)と述べた

    • 逆二乗の法則によって,ケプラーの第一法則と第二法則が導出可能であることが示されている
  • その後,あらゆる物体に引力があることを述べ,万有引力」を主張
    • 天上と地上が同じ物理法則に支配されていることを示した
      (リンゴが地に落ちるのも,月が地球に向かって引き寄せられた結果回転運動になるのも,同じく引力によるもの)
       → 古代天文学のドグマ「天地の区別」を打破
    • 引力という遠隔作用によって物体の強制運動が起こることを示した → 古代運動論のドグマ「強制運動の原因は接触による近接作用」を打破
    • プリンキピアの解説をするサイトもあるらしい: 楕円軌道の発見と万有引力の法則(「プリンキピア」の説明)

ここまでのまとめ

ざっくり絵にまとめるとわかりやすいかも,と思って自分用に作成したポンチ絵があるので載せます

f:id:nigimitama:20180604234010p:plain

f:id:nigimitama:20180604234020p:plain

もっと詳しい話

このあたりの話は古典力学という領域に属するらしく,講義ノートを検索してみるとこのあたりの詳しい話を読むことができます。

例えば高知大学の津江保彦氏の「物理学概論Ⅰ」は序盤の方でケプラーガリレオニュートンが発見した法則を概説しています。

科学革命(3) 機械論的自然観

  • 科学革命の背景にあって近代科学の成立を促したのは,自然観の根本的転回
  • 古代・中世のアリストテレス的自然観は,宇宙全体を一つの有機体ないし生命体になぞらえるという点で「有機体的自然観」と呼ぶことができる
  • 科学革命によって「有機体的自然観」から「機械論的自然観」に転換した

    • 機械論:自然現象に代表される現象一般を、心や精神や意志、霊魂などの概念を用いずに、その部分の決定論的な因果関係のみ、特に古典力学的な因果連鎖のみで、解釈が可能であり、全体の振る舞の予測も可能、とする立場。
  • 古代のアリストテレス的自然観

    1. 古代ギリシャの「運動」概念は,「可能態」から「現実態」への移行であり,広範な概念であり,種子から樹木への成長で例えることができるようなもの
    2. 「等しきものをもって等しきものを知る」というアナロジー(類比)の方法を使う
      • → 運動など自然現象について考える際に有機体(生き物)をモデルにするのは当然
    3. アリストテレスの「質料形相論(hylēmorphismus)」:あらゆる個物は「質料(hyle)」と「形相(eidos)」が合成されたもの
      • 質料:無規定な素材・材料(=可能態)
      • 形相:材料を限定する「かたち」(=現実態)
      • あらゆる運動(自然現象)は可能体としての質料が現実態としての形相を目指すことで生じる,という考え。
  • 中世のスコラ哲学
    • アリストテレス的自然観を基本的に継承した上で,形相を事物の本質的性質(nature)を現すもの(「実体形相」)と偶然的性質を現すもの(「付帯的形相」)に分けた
    • 実体形相が質料と結合すると実体が生成され,分離すると消滅する,と考えた
    • 例えば人間なら,体が質料で,霊魂が実体形相
    • 物体も,人間における霊魂のように,それをそのものたらしめている「実体形相」が宿っており,それによって物体の運動が引き起こされたり,性質の変化が生じると考えた

デカルトの「物心二元論

  • 省察』の構成

    1. 方法的懐疑
      • 知識の確実な基盤を探求するため,既存のあらゆる知識を疑い,否定した
      • →「我思う,故に我あり(cogito ergo sum)」:疑っている私の存在だけは否定できない
      • 存在するために身体や空間的場所を必要とせず,「思惟する(疑う)」という活動のみで存在を保証されている「私」のあり方は「精神」
      • 「精神」は,その存在をいっさいの物質的なものに依存しない「思惟実体」である
    2. 神の存在証明
      • 神が最も完全な存在者であり,欺瞞者ではない → 観念の客観的実在性(ひいては外的世界の存在)の確保
    3. 「物体」の本性を確認
      • 例えば,蜜蝋は常温では硬いが,加熱すれば液体となる → 抽象化すると残るのは「延長を持ち,柔軟で,変化しやすいあるもの」
      • 「物体」の本性は「延長」であり,生命的なものや精神的なものを含まない「延長実体」である(「物心分離」)
  • 物心二元論

    • 「物体」と「精神」はその本性が明確に異なる2種類の実体(他のものに依存せずそれ自体として存在するもの)
    • 世界は「物」と「心」という2つの実体からなる(物心二元論

心身問題(mind-body problem)

  • 物心二元論では,精神(思惟実体)と身体(延長実体)はそれぞれ独立した実体
  • しかし,人間は肉体が損傷すれば痛みがストレスになり精神に影響を与えるし,精神的ストレスが胃腸の障害を引き起こすこともある。
    「心身結合」の事実はどのように説明されるべきなのか。
  • デカルトの説明:人間の体内をめぐる動物精気(血液の微細な粒子)が媒体となり,脳の松果腺で精神と身体とが接触する

    • では,延長を持たない非物質的な精神がどのようにして身体と接触しうるのか?
    • デカルトは説得的な説明をすることができなかった
  • 心身問題は,自然界から「心」や「感覚的性質」を排除し,現象を物体の機械的カニズムによって説明しようとした科学的自然観が抱え込んだアポリア(哲学的難題)

    • 現代の科学・哲学にとっても避けられない課題
    • 現代科学は生命や精神から神秘的色彩を払拭し,基本的には「物質一元論(唯物論)」へ歩みを進めた
    • 脳科学などの科学的知見を踏まえて「心身問題」を「心脳問題」として捉えなおそうとしている「心の哲学(philosophy of mind)」という現代哲学の一分野がある

4. 近代――第二次科学革命

科学の制度

  • 近代科学は17世紀の科学革命を通じて方法論が確立され,「知的制度」が整った。
    科学知識が蓄えられ,後世に引き継がれるためには,「知的制度」が「社会制度」に組み込まれる必要があった

  • 大学の起源は古代ギリシアにおいてプラトンが紀元前387年頃に建てた「アカデメイア(academeia)」

    • アカデメイアで教育された主な科目:算術,幾何学天文学音楽理論
      • これらは必修科目という意味で「マテーマタ(学ばれるべきもの)」と呼ばれていた。
      • 「マテーマタ」はピュタゴラス学派(「万物は数からなる」と考える学派)に由来し,「数学(mathematics)」に派生

f:id:nigimitama:20180609180628p:plain

  • アリストテレスは「リュケイオン」という学園を創設
    • 「逍遥学派」と呼ばれる弟子たちと回廊を散歩しながら議論するスタイルを採った。
    • アリストテレス形而上学』では,学問が発達するためには人々が日々の生活に追われない時間的・経済的余裕,余暇(スコレー)が必要だと述べている。
      • ギリシア語「スコレー(schole)」は中世ヨーロッパにラテン語「スコラ(schola)」に
      • 「スコラ」はもとは「修道院の附属学校」を意味し,「スクール(school)」の語源

f:id:nigimitama:20180609223822p:plain

  • 「ユニバーシティ」の名を冠した高等教育機関が成立したのは中世後期の12~13世紀ごろ
    • 「総合大学(university)」の語源はラテン語「universitas(組合,ギルド)」で,特に「学生と教師の共同体」の意味
    • 12~13世紀に最初に成立したのはボローニャ大学パリ大学
    • ヨーロッパ中世の大学は一般に4学部制
      • 下級学部(哲学部):リベラルアーツ(自由学芸)を中心とする学部
      • 上級学部(神学部,法学部,医学部から成る):裁判官や官僚,医師などの専門的職業の資格と結びついた学部

f:id:nigimitama:20180609223914p:plain

リベラルアーツと機械技術

  • リベラルアーツliberal arts, 自由学芸,自由七科)

    • 古代ギリシャやローマにおいて,奴隷階級ではなく「自由人」である市民が人格形成するにふさわしい理性的学問という意味で「自由学芸」と呼ばれていたことから「自由」がつく
    • 三科:文法学,修辞学,論理学(弁証法
    • 四科:算術,幾何学天文学音楽理論
  • 機械技術(mechanical arts)

    • 職人階級(古代なら奴隷階級)の手仕事のことを指している。→ リベラルアーツの対となるのが機械技術
    • マイナスのイメージが強かった
      • プラトン『法律』では「市民は誰ひとりとして,職人の仕事に従事してはなりません」
    • 17~18世紀にプラスのイメージがつきはじめた
  • 「百科全書派」

    • 18世紀フランス啓蒙思想の中心にあった一派
    • 編纂した百科全書は『百科全書または学問,芸術,工芸の合理的辞典』と,学問(自由学芸)と技術や工芸(機械技術)を同列に並べている
    • しかし当時の大学はテクノロジーよりも自由学芸を重視し,教育に技術を取り入れることはしなかった
  • 高等教育機関への機械技術の導入

    • フランス革命後のフランスは,ヨーロッパ各国からの干渉戦争に立ち向かうために,軍事技術者を養成するための,大学とは異なる高等教育機関を作った
      → 1794年にパリに設立されたエコール・ポリテクニック(理工科専門学校)
    • ドイツでもこれに倣って高等工業専門学校(Technische Hochschule:TH)を設立

第二次科学革命:科学の制度化

  • 19世紀ヨーロッパにおいて,「第二次科学革命」あるいは「科学の制度化」と呼ばれる出来事が起こった
  • 科学者(scientist)と呼ばれる人が一つの社会階層として出現した
    • これ以前の科学研究は,専門的職業として行うものではなく,貴族や聖職者によって担われていた
    • 19世紀の半ばには,理工系の高等教育機関がヨーロッパ各地に建てられ,産業界でも企業内研究所を設立し始めた
  • 大学の改革も起こった:自然科学も取り入れ始めた
  • 「学会」も登場

5. 現代――「科学の危機」からの脱出

科学の危機(1) 数学の危機

  • 「数学の危機」を経て現代数学へと進化した

1. 非ユークリッド幾何学の発見と形式主義

  • ユークリッド幾何学ユークリッドが『原論』で置いた「平行線公準」が成立しない世界における幾何学
  • 当初,非ユークリッド幾何学は論理的可能性として存在する想像上の幾何学と考えられており,現実の三次元空間を記述するのはユークリッド幾何学だけだと考えられていた
  • ヒルベルト幾何学の基礎』は,非ユークリッド幾何学ユークリッド幾何学は同様に妥当な幾何学であることを明らかにした
    • 幾何学の公理(axiom)は我々の空間直観による自明の真理ではなく,任意の仮定あるいは規約であると考えた。
    • そして,公理の妥当性は,公理系の無矛盾性(互いに矛盾しないこと)や独立性(ある公理が残りの公理から導出できないこと)といった形式的な性格によって保証される,と主張した
    • ユークリッド幾何学も,その基本概念は現実の空間に対応物を持たなくても構わない。「点・直線・平面という代わりに,いつでもテーブル・椅子・ビールジョッキと言い換えることができなくてはならない」
      • このような立場を公理主義という。これにより幾何学は抽象数学のレベルへと上昇した。
      • ヒルベルトは公理主義を更に発展させ,数学は一定の規則に従って形成された数式の間の形式的な「式のゲーム」である,という考えに至った(形式主義
      • 20世紀の数学は形式主義の思想によって導かれていく

2. ラッセルのパラドックスと公理的集合論

  • 集合論で矛盾が発見された
  • ラッセルのパラドックス

    • すべての集合のうち,「自分自身を(要素として)含まない集合」をすべて集めた集合  R = \left \{x | x \notin x \right \} を考える
    •  R \in R(Rが自分自身を含む)を仮定すると,定義より R \notin Rとなる(「自分自身を含まない集合」の集合がRであるため,RはRの要素ではない)
    •  R \notin R(Rは自分自身を含まない)を仮定すると,定義より R \in Rとなる(「自分自身を含まない集合」の集合がRであるため,RはRの要素)
  • このパラドックスの解決に取り組む過程で「数学基礎論」という新たな学問分野が生まれた。

    • 数学基礎論:数学の基盤を論理学や哲学の観点から反省しようとする試み
    • このパラドックスに対しては,集合論の公理に一定の制限を加える(集合の作り方に制限を加える)ことで矛盾を排除
    • 現在では矛盾を含まない「公理的集合論」が構成されている
  • 参考

科学の危機(2) 物理学の危機

  • 物理学の危機:ニュートン力学など古典物理学の限界が明らかになり,現代物理学(相対性理論量子力学)が誕生した事態
  • 古典物理学をベースとした「力学的自然観」で解決できない難問
    1. 光の速度が一定であること
      • 当時は宇宙全体に充満しているエーテルという微細な物質を媒体として光が伝播すると考えており,光の速度は同じくエーテルの中を進む地球の公転速度の影響を受けると予想されていた。
      • マイケルソン・モーリーの実験(1887年)によって,光の速度は地球の公転速度の影響を受けないことが報告され,「では地球はエーテルの中で静止している(天動説)のか?」ということに
    2. 熱現象を支配しているエネルギーの均等分配の法則の妥当性が疑われた
      • 当時は原子や分子が力学法則に従うことを前提に気体の力学的理論を構築しており,エネルギーの均等分配の法則に行き着いた。
      • しかし,実験結果によって,熱現象を支配しているエネルギーの均等分配の法則の妥当性が疑われた

アインシュタインの「相対性理論

  • 相対性原理:物理法則は一定の速度で相対運動するすべての慣性系に対して同じ形をとる
    • (例:時速100kmの乗り物の中でボールを時速60kmで投げても,時速160kmの剛速球になるわけじゃない)
    • ニュートン力学が前提としていた「絶対運動」「絶対時間」「絶対空間」の概念が不要になった
  • 光速度不変の原理:光はどのような慣性系でも真空中を一定の速度で進む
    • エーテル」という概念が「真空」に変わった(エーテルの存在は否定した)
    • 上述の難問「1.光の速度が一定であること」が解決された

M. プランクの「量子仮説」

  • 古典力学:エネルギーなどの物理量は連続量と考える
  • 量子仮説:エネルギーなどの物理量は離散量と考える
    • 「エネルギーには最小単位があり,エネルギーはその最小単位の整数倍の値しかとらない」という仮説
  • 量子仮説によって上述の「2. エネルギーの均等分配の法則の妥当性が疑われた」が解決

日本の臨床心理士は根拠のない治療を行っているのかも

心理職のためのエビデンス・ベイスト・プラクティス入門―エビデンスを「まなぶ」「つくる」「つかう」という本を,心理統計が好きな友人から借りて読みました。

この本では,

  1. エビデンス(根拠)に基づく臨床の実践(Evidence-Based Practice)がいかに重要か
  2. エビデンスとは何か。EBPの実現のためには何をすれば良いのか。
  3. 日本の臨床心理においてエビデンスに基づく実践がいかに為されていないか

といったことが書かれていて,

私は最初「心理学系の実証分析の話をざっくり掴めたら良いかな」という意識で読んでいたのですが, それだけでなく,上に挙げた3番目の「日本でEBPがいかに遅れているか」という部分も大変ショッキングな事実を知ることができて,

「心理職のための」と書かれているものの,私のように一般の人にとっても有益な本だと思いました。

エビデンスに基づく実践(Evidence-Based Practice:EBP)とは

心理学におけるエビデンスに基づく実践とは,患者の特性,文化,好みに照らし合わせて,活用できる最善の研究成果を臨床技能と統合することである。

エビデンス至上主義ではなく,エビデンスは患者のためであり,患者の特性に合わせることを重視するという点は,治療の相手がいる臨床心理特有のものがあり,計量経済学のテキストとの雰囲気の違いを感じました。

エビデンスの質

エビデンスにはレベルがあり,質の高いものから順に

  1. RCT(ランダム化比較試験)の系統的レビュー(メタアナリシス)
  2. 個々のRCT
  3. 準実験
  4. 観察研究(コホート研究,ケース・コントロール研究)
  5. 事例集積研究
  6. 専門家の意見(研究データの批判的吟味を欠いたもの)

となり,EBMエビデンスに基づく医療)においてエビデンスと言うときは1・2を指します。

この本の実証分析の手法について触れている部分は,専門家でなくてもわかりやすく書かれていて,計量経済学分野の一般向けの本『原因と結果の経済学』を思い出します。

「原因と結果」の経済学―――データから真実を見抜く思考法

「原因と結果」の経済学―――データから真実を見抜く思考法

『原因と結果の経済学』ではエビデンスのレベルは

  1. RCTのメタアナリシス
  2. ランダム化比較試験
  3. 自然実験と疑似実験
  4. 回帰分析

と書かれていて,3以降が異なります。

心理学的な実証分析の手法の用語まとめ

  • 準実験:実際に何らかの介入を行ってその変化を測定する研究(臨床研究,介入研究)のうち,ランダム化した対照群を有しないもの

    • 前後比較研究:参加者の一群に介入を行って,その前後の状態を比較する研究
    • 不等価2群比較デザイン:介入群と対照群の比較をするが,割り付けは参加者の希望によるもの
  • 観察研究:研究者が実際に介入を行うことはなく,既に行われた介入や何らかの要因の影響を観察する研究

    • ケース・コントロール研究(症例対照研究):疾病に罹患した集団を対象に、曝露要因を観察調査する。次に、その対照として罹患していない集団についても同様に、特定の要因への曝露状況を調査する。以上の2集団を比較することで、要因と疾病の関連を評価する。
      • 例えば,現在うつ病に罹患している人と健康な人の群を比較し,過去に遡って親子関係の特徴を検討するような研究
    • コホート研究:特定の要因に曝露した集団と曝露していない集団を一定期間追跡し、研究対象となる疾病の発生率を比較することで、要因と疾病発生の関連を調べる
      • 例えば,現在の親子関係の特徴に着目し,アタッチメントに問題のある群とない群に分けて,将来に渡ってフォローアップし,うつ病を発症するか否かを比較するような研究

日本の臨床心理学研究の現状

「臨床研究と言うと事例研究のことだと理解されている向きがある」

  • 日本の学術誌『心理臨床学研究』の2011年から2014年8月までに発表された論文311件のうち,事例研究が198件(63.7%),準実験16件,RCTは0件
  • 一方,アメリカの学術誌 "Journal of Consulting and Clinical Psychology"では,203論文のうちRCT論文が118本,メタアナリシスが11本で,掲載された論文の約59%がRCTまたは系統的レビューで,事例研究は0件

だそうで,日本の臨床心理学研究は「エビデンスに基づかない医療」へとガラパゴスな進化をしたようです。
確かに,論文サイトで検索してみても,臨床心理学系でRCTの論文はなかなかヒットせず,数が少ないようでした。

この本では,執筆時点での疾患別エビデンスも述べられていました。

例えば,箱庭療法という,患者に砂場の箱庭におもちゃを並べさせる治療法が日本で好まれていて(箱庭療法の論文自体が少なく,その多くは日本語で書かれていて),箱庭療法にはエビデンスがないということも述べられていました。
私は小学生の頃に不登校になりカウンセラーに箱庭療法を受けた記憶があり,私にとって身近な臨床心理の治療法は箱庭療法だったわけですが,あれもまさに「エビデンスに基づかない治療」だったんですね。

私が箱庭療法を受けたのは10年前くらいですが,現在も日本臨床心理士会のWebサイトにも載っているくらいなので,おそらく今も現役の治療法なのでしょう。

本書では,害があることが2002年の論文で示されていた「心理的デブリーフィング(被災者に被災した時の状況を語らせたり,描かせたりすること)」という治療法を東日本大震災の被災者に対して行った臨床心理士の話も当時の新聞の画像とともに掲載されていました。エビデンスに基づかない治療の危険性は当時話題に上がったのだと思いますが(検索するとデブリーフィングを使わないようにと政府が注意喚起した文書も出てくるくらいなので),上に述べたように少なくとも2014年までの論文ではEBPは全然進んでいなさそうです。

今後,自分や自分の身近な人がカウンセリングのお世話になることがあったときには(なかなか無いと思いますが),「日本の臨床心理士の多くは根拠のない治療を行っているのかもしれない」ということを心に留めておき,ちゃんとした臨床心理士を選ぶよう努力する必要がありそうです。その時までに日本の臨床心理の状況が変わっていると良いのですが‥。

Rとe-statAPIで在庫循環図

「公的統計の読み方」をテーマにした一般教養科目を履修したところ,
景気判断の指標の一つである在庫循環図を書く機会があったのでメモします。

在庫循環図とは

  • 縦軸に鉱工業指数の在庫指数の前年比を、横軸に同生産指数の前年比をプロットしたもの
  • 通常,反時計回りに回りながら短期の景気循環を表す

f:id:nigimitama:20180505072058p:plain:w700

Rで実行

1. データの取得

2つの方法があります

  1. 経産省のサイトからダウンロードする
  2. e-stat APIからデータを取得する

私はe-statAPIを使いましたが,実は最終更新日が2017年の5月となっており,それ以降のデータはサイトからダウンロードするしかありません。

## 在庫循環図(鉱工業) ----------------------------------------------------
library(dplyr)

# e-stat
library(estatapi)
AppID <- "" # 自分のAPIのIDを入力

# 1. 統計を検索
#ResultData <- estat_getStatsList(appId = AppID, searchWord = "鉱工業生産・出荷・在庫指数")
#ResultData_df <- ResultData %>% as.data.frame()
#ResultData_df %>% head()

# 2. データの取得:0003181031 業種別/四半期、年、年度/原指数 付加価値額生産(平成22年=100.0) ----
#estat_getMetaInfo(appId = AppID, statsDataId = "0003181031")
output <- estat_getStatsData(appId = AppID,
                             statsDataId = "0003181031",
                             cdCat02 = "0001000" # 鉱工業
                             )

# 3. データの取得:0003181068 業種別/四半期、年、年度/原指数 在庫(期末)(平成22年=100.0) ----
#estat_getMetaInfo(appId = AppID, statsDataId = "0003181068")
stock <- estat_getStatsData(appId = AppID,
                            statsDataId = "0003181068",
                            cdCat02 = "0001000" # 鉱工業
                            )

# 4. merge ---------------------------------------------------------
df = data.frame(QE = output[20:56, c('統計項目A')][[1]],
                output = output[20:56, c('value')][[1]])
df = merge(df, 
           data.frame(QE = stock[20:56, c('統計項目A')][[1]],
                      stock = stock[20:56, c('value')][[1]])   )

# 5. 前年同期比を計算する。{(当期ー前年同期)/前年同期}----------
# 前年同期比関数
Year_on_year_rate <- function(x) {
  y <- NA
  for(i in 5:length(x)){
    y[i] = (x[i] - x[i-4])/x[i-4] # 四半期を使ったので-4
  }
  return(y)
}

# run
df <- data.frame(df,
                 output_r = Year_on_year_rate(df$output),
                 stock_r = Year_on_year_rate(df$stock)
                 )
df <- na.omit(df)

2. プロット

# 6. plot:2009Q1 ~ 2017Q1 ------------------------------------------------------
# デフォルトの関数でplot
plot(df$output_r, df$stock_r, type = 'l')
points(df$output_r, df$stock_r)

f:id:nigimitama:20180505064414p:plain:w700

# ggplotでplot
library(ggplot2)
windowsFonts(Yu = windowsFont("Yu Gothic UI")) #新しいフォントファミリーを定義

g <- ggplot(df, aes(x = output_r, y = stock_r)) +
  geom_point(color = "royalblue", alpha = 0.7, size = 2) +
  geom_path(color = "royalblue", alpha = 0.7)+  # geom_lineではなくpathを使う
  labs(x = "生産前年同期比(%)", y = "在庫前年同期比(%)",
       title = "在庫循環図(鉱工業)")+
  theme(text = element_text(family = 'Yu'))+ # 日本語フォント指定
  # 軸
  geom_vline(xintercept = 0)+
  geom_hline(yintercept = 0)+
  geom_abline(intercept = 0, slope = 1, lty = 2)+
  geom_abline(intercept = 0, slope = -1, lty = 2)+
  # データラベル
  geom_label(aes(label = QE, x = output_r, y = stock_r),
             alpha = 0.3, vjust = 0, color = "steelblue")
g

f:id:nigimitama:20180505064537p:plain:w700

# 7. plot:2014Q1 ~ 2017Q1 ------------------------------------------------------

g <- ggplot(df[21:33,], aes(x = output_r, y = stock_r)) +
  geom_point(color = "royalblue", alpha = 0.7, size = 2) +
  geom_path(color = "royalblue", alpha = 0.7)+  # geom_lineではなくpathを使う
  labs(x = "生産前年同期比(%)", y = "在庫前年同期比(%)",
       title = "在庫循環図(鉱工業)")+
  theme(text = element_text(family = 'Yu'))+ # 日本語フォント指定
  # 軸
  geom_vline(xintercept = 0)+
  geom_hline(yintercept = 0)+
  geom_abline(intercept = 0, slope = 1, lty = 2)+
  geom_abline(intercept = 0, slope = -1, lty = 2)+
  # データラベル
  geom_label(aes(label = QE, x = output_r, y = stock_r),
             alpha = 0.3, vjust = 0, color = "steelblue")
g

f:id:nigimitama:20180505072505p:plain:w700

文系学部生・新卒からデータサイエンティストになるには?

文系学部生というデータサイエンスの王道からはやや外れた立場から,「データ分析を仕事にする(総合職ではなく職種別採用で働く)」という軸で就職活動をしてみて分かってきたことをメモします。

まず,ビジネスにおけるデータ分析の使われ方を確認し,その次に具体的な「データ分析を使う業界」について述べていくという構成になっています。

1. ビジネスにおけるデータ分析の使われ方

1-1. データ分析のレベル

「データ分析」といってもレベルは様々です。「我が社ではデータ分析の業務ができます!データサイエンティストになりたい学生募集中!」みたいな企業があったとしても,話を聞いてみると集計して表やグラフを作り,解釈する業務だったり…なんてこともありました。

まずビジネスでのデータ分析の種類を把握する必要があります。

有名どころの「データ分析のレベル」の分類方法では,以下のような分け方をしているようです。

1. Descriptive Analytics(記述的分析)
データから,「何が起きたのか」を明らかにする。
グラフや表で可視化する,データを解釈するストーリーを考えるなど。

2. Diagnostic Analytics(診断的分析)
データから,「なぜ起きたのか」を明らかにする。相関関係を調べるなどして,より深く調べていく。

3. Predictive Analytics(予測的分析)
確率的な予測を行うモデルを構築する。

4. Prescriptive Analytics(処方的分析)
データから,「何をすべきか」を明らかにする。予測されたモデルから最適な方策を立案する。
例えばレコメンデーションシステムのように,予測結果から提案を最適化するようなもの。

とりわけ,「記述的・診断的な分析」をするレベルなのか,それともより高度に「予測的・処方的な分析」をするレベルなのかが業務の性質を大きく変えると思います。

就職活動の会社探し・業界探しの観点で言うと,私は就職活動を初めた頃にマーケティングリサーチ最大手の株式会社インテージを知り,そこのデータアナリストはマーケティングの分析だけでなく広告予算配分の最適化という「予測的・処方的な分析」も行っているようで,マーケティングリサーチ業界に興味を持つようになりました。

その後もマーケティングリサーチ業界を見ていたのですが,次第にミスマッチを感じるようになりました。というのもマーケティングの場合は予測して自動化とかよりも原因を診断するほうが重要なので,多くのマーケティングリサーチの企業のデータアナリスト職の仕事は「記述的・診断的な分析」がほとんどで,たまに回帰分析や決定木を使うとしても診断的分析の目的で使用しているようでした。

就職活動のときには,自分がやりたい「データ分析」とは「記述的・診断的な分析」なのか「予測的・処方的な分析」なのかを明らかにし,企業を探す時にはその企業の言う「データ分析」がどのレベルなのかを調べる必要があります。

1-2. 統計学機械学習

私はもともと統計学をゆるく勉強していて,後々になってから機械学習にも手を出すようになった人間なので初めの頃は知らなかったのですが,

「予測」をする際には統計学よりも機械学習の方が精度が良いです。

(ざっくり言うと表形式のデータだとXGBoostやLightGBMといったアンサンブル系が強く,画像認識ならCNNが強い印象。統計学の出番はほとんどない。)

なので,「予測的・処方的な分析」をする場合は機械学習がほとんど必須になります。

なんとなく「大学で学んだことが活かせる仕事に就きたい」と思っているゆるふわ統計勢の人には注意が必要な点かなと思います。

1-3. データ分析の職種

データ分析系の職種は主に以下の3種類があるかなと思います。

1. データアナリスト

  • 「記述的・診断的な分析」が主業務である企業が多い印象(仕事のアウトプットはレポート)
  • 必要なスキル:統計学+ビジネス力(経営学マーケティング論,プレゼンなど)
  • 分析はR,SPSSSAS,その他ツールを使う。プログラミングが必須でない企業も多い印象。

2. データサイエンティスト

  • 「記述的・診断的な分析」と「予測的・処方的な分析」の双方を行う(仕事のアウトプットはレポート)
  • 必要なスキル:統計学+ビジネス力+機械学習+プログラミング(分析)
  • R,Pythonなどのプログラミングの能力が必要な企業が多い印象

3. 機械学習エンジニア

  • 「予測的・処方的な分析」を自動化するシステムを作る職(仕事のアウトプットはシステム)
  • 必要なスキル:統計学機械学習+プログラミング(分析)+ プログラミング(システム開発
  • 深層学習の論文に登場する数式をプログラミングして実装できる能力が必要とされることも

※この解説は私の個人的な印象に基づきます。誤りがあるかも‥
※職種の定義は企業によって結構異なります。

ちなみに,これらの3職種の新卒1年目の年収は,

  • データアナリストとデータサイエンティストは同程度(~420万円)
    • 一般的な総合職と比べても,そこまで高いわけでもない
  • 機械学習エンジニアは上限が高い(~1,000万円)

という感じです。

f:id:nigimitama:20180415193030p:plain

企業の例としては以下のような感じ。機械学習エンジニアが最も市場から求められている感じがします。

f:id:nigimitama:20180415193022p:plain

しかし,文系学部卒ではこれらの高給な機械学習エンジニアになるのは難しいと思います。
ソフトウェア開発(Java等)ができることが必要であったり,機械学習についての高い専門性を要求する企業もあります。
大学の専攻と関係なく趣味でソフトウェア開発をしているような人であれば良いですが‥

2. データ分析の職種別採用がある業界

「データ分析人材を必要としていて積極的に雇用しようとしている企業はどこなのか」という点は就活中にとても悩まされました。なのでここでは会社選びのヒントとなるようにデータ分析を使う業界について述べていきます。

以下の図は,私がデータ分析職の職種別採用を行っているのを見かけた企業の業界を,事業の「コンサル / 事業会社」,業務内容の「アナリスト寄り / エンジニア寄り」の2軸で散布したものです(業界というか部門もありますが…)。

f:id:nigimitama:20180415192909p:plain

なお,「コンサル / 事業会社」という軸を設けたのは,それぞれ一長一短あり重要な軸であるためです。
現在私は以下のようなメリット・デメリットがあるのではないかと想像しています。

f:id:nigimitama:20180415192849p:plain

具体的な業界を述べていくと,

2-1. マーケティングリサーチ(市場調査)業界

  • 業界の概要

    • ざっくりいうと「今,人々は何を求めているのか。何が売れそうなのか。」を調査するのが市場調査
    • データを保有している / アンケートの協力者を保有している ことを活かして企業のマーケティングコンサルティングする。
    • 主に「記述的・診断的な分析」を行う
    • 基礎的な統計学と社会調査士のスキル(実査や分析のスキル)が直接的に役立つ可能性がある業界
  • この業界の企業の例

    • 株式会社インテージ
      • 国内1位,世界9位の売上高(479億円,社員1000名ほど。平均年収746万円/39歳)
      • 事業は広告業界にもまたがっており,データサイエンティストは階層ベイズモデルを用いた広告の最適配分の推定といった仕事も行なう
    • 株式会社マクロミル
      • 売上高355億円,1946名。平均年収528万円(32.4歳)
      • 規模は国内2位くらい,インターネットリサーチに特化。
    • 株式会社ロイヤリティ・マーケティング
      • Ponta」のポイントカード事業によって得た購買行動データを基にコンサルティングを行なう
      • 顧客に要因を説明できるアルゴリズムが重視され,回帰分析と決定木を使う仕事がほとんどらしい
    • 株式会社ヴァリューズ

2-2. デジタルマーケティング業界

  • 業界の概要

    • マーケティングの企画・提案を行なう業界
    • AI,VRを含むデジタルテクノロジーをマーケティングに応用していく
    • 企業のWebサイトのアクセス改善などの業務が多め?
    • 主に「記述的・診断的な分析」を行う?
  • 事例

    • Web解析:行動ログを確認して,つれてきたい人が来てくれているかを調べてPDCAを回す
    • ソーシャルリスニング:Twitterやブログなどからテキストを収集し(収集するツールがある),その企業がどう見られているかを分析する
    • 広告のROI分析:何人がCMを見て,何人が買っているのか調べる,クライアントが保有する出稿料データと売り上げデータの重回帰分析などで相関分析を行なう,など
  • この業界の企業の例

    • 株式会社D2C(ドコモと電通の子会社)
    • 電通アイソバー株式会社(電通とアイソバーの子会社)

2-3. 総合コンサルティングファーム

  • 業界の概要

    • テクノロジーやデータ分析による問題解決も含めた幅広いコンサルティングを行なう
    • 「記述的・診断的な分析」と「予測的・処方的な分析」の双方を行う
    • 企業によっては分析を市販のツールで済ませる事例も多い模様?
  • 事例

    • 決定木によるマーケティングのためのセグメント分類とキャンペーン提案
      :保険会社において,「契約更新しにくい客」の特徴を分析し,マーケティングのキャンペーンを検討
    • CRM(Customer Relationship Management:顧客関係管理)のための顧客分析
    • 製造工場における品質向上
      • 海外の工場の「操業監視」「異常検知」「故障の予測」を行なう
      • 製造途中の仕掛品の各種データから完成までに不良品になることを予測し,工場の不調を検知・制御
  • この業界の企業の例

2-4. データ分析コンサルティング

  • 業界の概要

    • データ分析による課題解決を請け負う
    • 「記述的・診断的な分析」と「予測的・処方的な分析」の双方を行う
  • 事例

    • 深層学習による画像解析を用いた,工場における不良品検知
    • 状態空間モデルを用いた食品の需要予測(外食産業)
  • この業界の企業の例

    • 株式会社ブレインパッド
      • 2004年創業。この業界では古参で最大手。
      • 売上高35億円,216名:社員一人あたり1600万円の売上高,平均年収640万円(34.1歳)
    • 株式会社ALBERT
      • 売上高8.7億円,88名:社員一人あたり約1000万円の売上高,平均年収655万円(33.7歳)
      • 技術はありそうだが稼ぐ力は微妙?。営業キャッシュフローもマイナスが目立つ
    • 株式会社ホットリンク:SNSネット掲示板データの分析に強み。平均年収595万円(35.1歳)
    • 株式会社ダブルスタンダード:売上高14億円,平均年収527万円(35.6歳)
    • データセクション:売上高6億円,平均年収337万円(30.5歳)
    • スカイディスク:製造業の工場に対するデータ分析コンサルに特化したベンチャー

2-5. システムインテグレーターSIer

  • 業界の概要

    • クライアント企業に対してIT面でのコンサルティングを行なう業界
    • データ分析がやりたい人にとってのデメリットとしては,分析だけでなくエンジニアの仕事もしなければいけない企業も多いこと -「予測的・処方的な分析」を行う
  • この業界の企業の例

2-6. 事業会社のマーケティング部門

  • 業界の概要

    • メーカーのマーケティング部門などに所属し,自社のマーケティングのためにデータ分析を使う仕事
    • 大手企業の場合,希望の部門に行くことができるかという「配属リスク」がある
    • 「記述的・診断的な分析」と「予測的・処方的な分析」の双方を行う
  • 事例・企業の例

    • 本田技研工業(ホンダ),ビジネス開発統括部ビジネスアナリティクス課
      • 事例①:車のデザインの評価:SNSでの評価を感情分析し,新しいデザインがどう評価されるかを予測
      • 事例②:乗り心地の評価:車に乗っている人の脳波などの生体反応データと車の速度などのデータの関係から,クルマの状態によって乗っている人の感情がどう変化するかを分析
      • (参考:クルマのデザインや乗り心地……「感性」も科学的に評価するホンダの取り組み - 日経BigData http://business.nikkeibp.co.jp/atclbdt/15/258684/041900073/

2-7. 事業会社のデータ分析部門

  • 業界の概要

    • マーケティングだけでなく新規事業の提案も含めて様々な部分にデータ分析を活用する仕事
    • 「記述的・診断的な分析」と「予測的・処方的な分析」の双方を行う
  • 事例

    • 営業の最適化:自社ホームページで資料請求を行った顧客のうち成約率が高い顧客を予測し,選別して追加的な営業アプローチをかけて契約をとる
    • 物件仕入れの最適化:入ってくる物件情報から「売れない物件」を予測して排除し,「売れそうな物件」のみを仕入れる
  • この業界の企業の例

    • エムスリー株式会社
      • 医師向けのWebサイトを運営。日本に30万人いる医師のうち,25万人が会員登録をしている。
      • データ分析部門があり,データアナリスト職採用を行っている
    • 株式会社GA technologies
      • テクノロジーの導入が遅れていた不動産業界でAIを活用しているベンチャー
    • Sansan株式会社
      • Sansanは日本に4人しか居ない「Kaggle Grandmaster」という称号を持つトップクラスのデータサイエンティストが2人在籍している,データ分析に注力しているベンチャー
      • 研究開発部門ではなくビジネス部門でのデータ活用を行なう人材として「データアナリスト」職採用がある

2-8. アドテクノロジー業界

  • 業界の概要

    • 広告配信の最適化に統計学などのデータ分析を活用する
    • デジタル広告は「どんな人に送った結果,どれだけ効果がでた」という情報がわかり効率が良いため,市場は拡大傾向(広告市場自体は縮小しているものの,デジタル広告の比率は増加)
    • 「予測的・処方的な分析」を行う
  • 事例

    • 広告の買い付けシステム
      • ユーザーがWebサイト等を閲覧して広告枠を表示するときに,背後では広告枠のオークションが行われている。
      • 広告の枠のオークションが始まった時,「広告の種類」「広告の枠」「ユーザーの属性」といったデータから,広告のCTR(クリック率)やROI(費用対効果)を予測し,「何円で買う」とオークションに参加する
        → 広告を出した結果,どれだけクリックされ,どれだけ買ってもらえたかがわかる
        → そのデータをもとに,より良いCTR予測モデルを構築する
      • このシステムは瞬時に行われる広告枠の売買で使われる関係上,計算がすぐに終わるロジスティック回帰を使う事が多い
  • この業界の企業の例

    • ユナイテッド株式会社(データサイエンティスト採用がある)

2-9. 事業会社のシステム開発部門・研究開発部門

  • 業界の概要

    • 研究開発やシステム開発だけでなく,機械学習などのデータ分析も活用していく
    • デメリット・留意点:エンジニアの仕事をすることになる場合もある,という配属リスクがある。
    • 「予測的・処方的な分析」を行う
  • 事例

    • 深層学習によるSNS画像解析を用いた「自社製品の使われ方」の分析やマーケティングへの応用
    • 研究開発過程で得たDNAデータの解析
  • この業界の企業の例

    • DeNA
      • データ分析に注力しており,Kaggleの優秀者は業務時間中にKaggleができるほどの注力ぶり
      • 日本に数十名しか居ないKaggle Masterのうち4名が在籍
    • Sansan
      • 名刺の画像認識が主要事業なので画像認識を専門にした機械学習エンジニアがいる
      • 日本に4人しか居ないKaggle Grandmasterという称号を持つトップクラスのデータサイエンティストが2人在籍
    • メルカリ
    • サントリーシステムテクノロジー(サントリーグループのシステム部門)
      • 一部のエンジニアは「先端技術部」に配属され,機械学習エンジニアとして働く
    • ヤフー
      • 「データプラットフォーム&サイエンス領域エンジニア」という職種別採用がある。
      • しかし,データ分析は㈱ブレインパッドに委託することが多い模様。採用で出会った面接官も「kaggle?なにそれ?」みたいな反応だった
      • 2018年頃から「データの会社」を標榜し始めたので,もしかしたら今後はデータ分析に注力するかもしれない。データは大量に保有しており,ディープラーニング用に作った世界2位のスパコン「kukai」を保有しているため解析できる環境もある。

参考

データ分析のレベルに関しての参考文献です

Prescriptive Analytics - Gartner IT Glossary

アナリティクスの進化(Descriptive からPrescriptiveへ) | 欧州進出のIT支援はNewton IT

私が就活で体感した情報ばかりなので全く網羅的ではないと思いますが,データ分析を仕事にしたいと考えている就活生のお役に立つことがあれば幸いです。

[読書メモ]津川 友介『世界一シンプルで科学的に証明された究極の食事』

世界一シンプルで科学的に証明された究極の食事

世界一シンプルで科学的に証明された究極の食事

を読みました。

この著者は過去に『「原因と結果」の経済学―――データから真実を見抜く思考法』という計量経済学・統計的因果推論の本を書いていて,そちらの本も面白かったので,今回の本も買ってみました。

この本は,初めにエビデンス(科学的根拠)のレベル(RCTのメタアナリシスが最もエビデンスレベルが高い,など)について述べて,その後本題に入ってからもエビデンスとそのレベルに基いて述べていたので(「こういう研究結果もあるが観察研究なので参考程度にしよう」みたいな),その点が学者らしい誠実な書き方だと思いました。

色々書かれているのですが,高いエビデンスレベルで分析されていて特に気をつけるべき食品は以下のものでした。

  • 高いエビデンスレベルで『健康に良い』ことがわかっている食品

    1. 野菜と果物(ジュース,じゃがいもは除く)
    2. 茶色い炭水化物(玄米や全粒粉など精製されていない炭水化物)
    3. オリーブオイル
    4. ナッツ
  • 高いエビデンスレベルで『健康に悪い』ことがわかっている食品

    1. 牛肉・豚肉などの「赤い肉」(鶏肉は含まない)とハムやソーセージなどの「加工肉」
    2. 白い炭水化物(白米や小麦粉などの精製された炭水化物及びじゃがいも)
    3. バターなどの飽和脂肪酸

野菜・果物と魚を摂取するように心がけ,それでは満腹感が足りないなら玄米や全粒粉の炭水化物やナッツ(ピーナッツも良いらしい)を食べよう,という感じですね。

以前に私が受講した栄養学の授業で聴いた話と近いものも多かったので,私にとっては結構受け入れられる内容でした。

[読書メモ]『やり抜く力 GRIT』

『やり抜く力 GRIT』

やり抜く力 GRIT(グリット)――人生のあらゆる成功を決める「究極の能力」を身につける

やり抜く力 GRIT(グリット)――人生のあらゆる成功を決める「究極の能力」を身につける

日本では2016年に出版され,その頃流行っていた本を2年遅れで読みました。

流行りの本にはなんとなく懐疑的で,この本も名前だけ知っていて読みはしなかったのですが,読んでみると,この本は学者が書いたものであり,中身は学術的な実証研究の結果を基に論じているため,非常に説得力がある本になっています。

この本の要点をざっくりまとめると,以下のような感じです。

  1. 成功に必要なのは「才能」ではなく,「情熱を持って努力し続ける力(やり抜く力:GRIT)」である
    • やり抜く力 = 情熱 + 粘り強さ
    • 情熱 := 一つの目標に継続的に取り組むこと。
    • 粘り強さ := 挫折してもあきらめずやり遂げること。
  2. 「やり抜く力(GRIT)」は伸ばすことができる
    • (1) GRITを自分自身で「内側から伸ばす」方法
      • 興味を掘り下げる:なにかに興味を持ち,疑問をもって学び,同じ興味を持つ仲間を探す
      • 「自分のスキルを上回る目標」を設定してはそれをクリアする練習を習慣化する
      • 自分が取り組んでいることが,自分よりも大きな目的(人々の役に立つこと)と繋がっていることを意識する
      • 絶望的な状況でも希望を持つことを学ぶ:失敗しない人はいない。失敗から学ぶことが重要。
    • (2) GRITを「外側から伸ばす」方法
      • 親・上司・メンターなど周りの人々が,GRITを伸ばすために重要な役割を果たす。
  3. GRITが強いほど,「幸福感」も強い
    • 成功(コンテストでの優勝,部署でのトップの業績など)と幸せは関係があるものの,同じものではない。
    • 2000人に対するアンケートでは,GRITが高いほど「人生への満足度」も高かった。
  4. GRITだけが重要なわけではない
    • 人の性格は複数の特徴からなる
    • 「偉大さ」と「善良さ」は異なるものであり,どちらかといえば「善良さ」のほうが重要だと筆者は思っている.
    • 過去の研究でも,人々が人を評価するときに最も重要なのは「道徳性」だった

「能力よりも努力(費やした時間)が重要だ」といった話は時折見かけますし,私も経験的にそう思うことはありますが,それを実証した研究結果とともに述べてくれているので,「自分の認識は正しかったんだ!」と納得できます。

著者が元教師であることもあり,人のGRITをどう育てたらよいかといった点についても過去の研究結果を引用しつつ述べていたりするので,人を育てる立場にいる人にとっても良い本だと思います。

ネット上の他の紹介記事でもこの本の内容の概要を掴めると思います:

内容の密度も結構高くて,買って損のない良い本でした。興味があったら買ってみてください。