盆暗の学習記録

データサイエンス ,エンジニアリング,ビジネスについて日々学んだことの備忘録としていく予定です。初心者であり独学なので内容には誤りが含まれる可能性が大いにあります。

2021-01-01から1年間の記事一覧

「150 successful machine learning models: 6 lessons learned at booking. com」を読んだ

KDD19で発表されて一時期話題になっていたBernardi et al. (2019) 150 Successful Machine Learning Models: 6 Lessons Learned at Booking.comを読みました。 これは宿泊施設を検索して予約できるウェブサイト「Booking.com」における機械学習の活用事例と…

『データ分析と意思決定理論』を読んだ

『データ分析と意思決定理論』を読みました。 マンスキー データ分析と意思決定理論作者:チャールズ・マンスキーダイヤモンド社Amazon この本は経済学者が書いた一般向け(非専門家向け)の本で、第1部がデータ分析、第2部が意思決定理論という構成になって…

NGBoostの理論のまとめ

NGBoost: Natural Gradient Boosting for Probabilistic Predictionの論文を読んだのでメモしておきます。 ざっくり要約すると以下のような感じでした。 NGBoostは予測を点ではなく分布で予測するための機械学習アルゴリズム 勾配ブースティングの枠組みで最…

pystanの環境構築で詰まったときのメモ

変なつまり方をしたのでメモ まとめ dockerのpython:3.9をベースイメージに環境を作ろうとしていたが、動かなくて困っていた pystan 3.0 は gcc ≥ 9.0 が必要であるにも関わらず、python:3.9のイメージに入っているgccはver.8系だったのが原因と思われる ubu…

[python]loggerの出力が重複するのを防ぐ

pythonのloggingを使うときのメモ 背景 loggerインスタンスにStreamHandlerやFileHandlerを設定する処理は使いまわしたいので、関数にしたい。 その際、単純にその処理を関数にまとめると、その関数が複数回呼ばれて同じ名前のloggerが複数回参照された場合…

LightGBMの理論のまとめ

今更ながらLightGBMの論文を読んだのでその時のメモを残しておきます。 ※GPUでの計算への適応など、計算機での活用に関する技術については省略しています。 要約 LightGBMが使う既存の技術 pre-pruning early stopping問題 best-first (leaf-wise) tree hist…

LightGBMの「No further splits with positive gain」というwarningの意味

LightGBM関連の論文やソースコードを読んでいてわかったことをメモ 概要 LightGBMを使っているとたまに No further splits with positive gain, best gain: -inf のようなwarningが表示されることがある。 これはLightGBMが内部で決定木を成長させている際に…