盆暗の学習記録

データサイエンスを中心として,日々学んだことの備忘録としていく予定です。初心者であり独学なので内容には誤りが含まれる可能性が大いにあります。

手元の本を電子書籍にした

就職を機に都心の狭くて安い物件に引っ越すので荷物を減らそうと努力しています。 私が持っている本棚の使い勝手がイマイチで,専有する場所の割には本があまり入らない(文庫本向けっぽくて専門書があまり入らない。未使用の空間が多く生まれる)ので,一つ…

[R]R markdownでコードからmarkdownを書く

R

よくR markdownを使っているのですが, 変数に格納した文字列を見出しに使う forループを使って複数の節や小見出しを作る といったコードからmarkdownを書くという操作がしたくなるときが時折あります。 ちょっと調べてみたのでメモ。 文字 見出し 文章 グラ…

[R]ゼロから作る最尤法・ロジスティック回帰

(function () { var script = document.createElement("script"); script.type = "text/javascript"; script.src = "https://mathjax.rstudio.com/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML"; document.getElementsByTagName("head")[0].appendChild(…

[読書メモ]『ビジネスフレームワーク図鑑』

ビジネスフレームワーク図鑑 すぐ使える問題解決・アイデア発想ツール70作者: 株式会社アンド出版社/メーカー: 翔泳社発売日: 2018/08/29メディア: 単行本(ソフトカバー)この商品を含むブログを見る 半額セールを利用して買ってみました。 ”フレームワーク…

[読書メモ]話し方・会話に関する本

話し方に関する本3冊に目を通したのでざっくりメモ。 『「話し方」の授業』 あがってしまうシーンでも相手にきちんと伝わる「話し方」の授業作者: 高津和彦出版社/メーカー: 日本実業出版社発売日: 2016/04/21メディア: 単行本この商品を含むブログを見る ビ…

[R]ゼロから作る最小二乗法2:重回帰

「自分で数式をコードに落としていって動かす」という作業は非常に勉強になると思ったので,いろんなアルゴリズムをゼロから作っていきたいと思います。 理論の要点を整理してから実装する構成で述べていきます。 モデル 線形回帰(linear regression)は,…

本の安売りセール情報を知りたい

最近SNS経由で 翔泳社の50%OFFセール と 「まんがで読破」シリーズの99%OFFセール を偶然知り,たいへん得しました。 今回はたまたまTwitter等で見かけて知ることができたものの,こういうお得な情報を見逃すことは減らしたいものです。 どうしたらお得な情…

[R]ゼロから作る最小二乗法1:単回帰

(function () { var script = document.createElement("script"); script.type = "text/javascript"; script.src = "https://mathjax.rstudio.com/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML"; document.getElementsByTagName("head")[0].appendChild(…

愛媛県に行ってきた

愛媛県に行って松山市をうろうろしたので,せっかくなので印象に残ったこととかをメモしておきます。 (記憶力が極めて貧弱なので,せっかくどこか行って写真撮っても言葉とともに整理して記録しないと忘れちゃうんですよね…) 松山城 萬翠荘 道後温泉 伊予…

[R]交差項や2乗項を作る

R

どうやるのかちょっと悩んだのでメモ。 交差項 切片を除く もっと多数の場合 留意点 2乗項 交差項 交差項等を作りたいときはmodel.matrix()を使うといいようです。 object引数にformulaを指定して,変数名を*でかけ合わせて交差項を作ります。 library(tidy…

使用を避けるべきグラフ

最近グラフつくってて思ったことをメモ 円グラフを使わない 帯グラフもあまり良くないかも 参考:グラフづくり全般で参考になる記事 (参考)記事中のグラフのコード 円グラフを使わない 「円グラフわかりにくいから,棒グラフを使え」という話です(人間は…

[R]BBCニュースで使われるグラフを描く{bbplot}パッケージ

BBCニュースで使われるグラフのスタイルを再現する{bbplot}というパッケージの存在を知りました github.com ちょっと使ってみたいと思います。 インストールと実行 Windowsだと警告がでる 折れ線グラフ 棒グラフ まとめ 参考 インストールと実行 ggplotのテ…

[Python]パソコンのバッテリがおかしいのでログを取る

動機 昨年の11月にVAIO S13を買ったのですが,購入当初から「バッテリが少なくなっています」という警告が出ずにいきなりバッテリ切れでスリープに入ることがありました。 指紋リーダーもフリーズすることがよくあったので,「ソフトウェア(Windows?)のイ…

パソコン蛾物故割れたのでMBを替えた

パソコン(のBIOS)が起動しなくなって,いろいろと試行錯誤した結果,マザーボード(MB)の載せ替えで直った,という経験をしたのでメモしておきます。 問題発生時の状況 グラボの載せ替え Windowsの破損 問題発生時のPCの状態 試した解決策1:Windowsの修…

[R]{stargazer}でロバスト標準誤差を使用した分析結果を載せる

R

問題 解決策 例(2つの回帰モデルの場合) 参考 問題 Rでロバスト標準誤差を使うときはsandwich::vcovHC()でロバスト標準誤差の分散共分散行列を算出し,lmtest::coeftest()を使ってRの標準的な結果表示のスタイルに似せた結果表示をする,というのが基本的…

サイトの「タイトル」と「URL」を取得するChrome拡張機能

あるサイトを閲覧していて,「お,このサイトは有益だな,メモしておこう」と思った時, そのサイトのタイトルとURLを簡単に取得したいと思ったことはありませんか? 私がGoogle Chromeに移行したのは最近でして,それまでは長い間Sleipnirという日本の企業…

統計調査士の概要と対策方法

以前,統計検定2級に関する記事を書きました。 統計検定2級レベルまでの教材と勉強方法 - 盆暗の学習記録 この統計検定と同じ協会が運営している資格試験で,もっとマニアックな統計調査士という資格があるのでそちらのご紹介をしたいと思います。 統計調査…

[R]データ型の一括変換

R

csvファイルはreadr::read_csv()を使えば適切な型を考えて読み込んでくれますが,Stataの.dtaをhaven::read_dta()で読み込んだ場合などは,データ型が適切なものになっていない場合があります。 library(tidyverse) library(haven) # データの読み込み df <-…

[R]R MarkdownをPDFにして論文を書くときのテンプレート

R

昨年は卒論の執筆を先延ばしにしてきた1年で,2019年になってから急いで書き上げて1月7日に提出期限ギリギリに提出することになりました… そんなときに本当に助かったのがRmarkdownからpdfでknitする機能です。 Rで出力した図表をwordに手動で貼り付けたりし…

就活のときの振り返り・おすすめ就活サービス

就活を終えてからだいぶ経つんですが,私が就活したときのこと(どんなサービスを利用したとか)をメモっておきます。 誰かの参考になれば幸いです。 私について 2~4年生でやってきたこと 2年生 春~夏:なにもせず 秋:インターンに参加 3年生 春:自己分…

早生まれの人は大変らしい

最近,実証分析の事例で「早生まれの人が損してる」系の話を聞いたのでメモ。 早生まれとは 早生まれのデメリット 身体能力の差 ① 子供時代の差 ② プロになる人の差 学力の差 → 学歴・年収の差 自殺率の差 どうすればいいのか (追記・おまけ)アメリカの場…

宅建の実務講習に行ってきた

宅建の試験(宅地建物取引士資格試験)に合格した人で,宅建士としての登録を希望する人で,「2年以上の宅建業の実務経験」がない人は,国土交通大臣指定の登録実務講習というものを受講する必要があります。 最近この講習を受けてきました。 登録実務講習に…

[Windows]エクスプローラーのアドレスバーが思ったより便利だった

Windowsの小ネタです。 エクスプローラーのアドレスバーってパスを指定するくらいしか出来ないのかと思っていたのですが,プログラムを実行したりできるみたいです。 1. プログラムの実行 2. 任意のディレクトリでコマンドプロンプトを起動 WSLのUbuntuでは…

TensorFlow-GPUのインストールで詰まったときのメモ

久々にTensorFlowを使おうとしたら動かなくて(最近Rでkerasをインストールするときに失敗したから…?),再インストールしようとしたら詰まったので対処法をメモ 対処法というのもおこがましいレベルで,要するに「最新版じゃなく,少し古いバージョンのTen…

[R]Webサイトをスクレイピングしてxlsxをダウンロードする

R

Rでスクレイピングするときの基本的な手順 Rでネット上のデータをダウンロードするときの方法 についてメモ。 やりたいこと ①{rvest}によるスクレイピング 1. htmlの読み込み 2. 目的のタグ・URLを抽出 div要素を抽出 a要素を抽出 URLを抽出 リンクテキスト…

HackMDというmarkdownエディタがスゴイ

以前こんな記事を書いていました nigimitama.hatenablog.jp メモ系のアプリを比較してみて,自分にはTyporaが一番あってるな,と結論づけました。 nigimitama.hatenablog.jp ところが先日,友人と共同でメモを書きたいな,となったときに,「共同編集が可能…

Rのround()は四捨五入をするわけではない

round関数の意味を誤解したまま使っていて面倒なことになったのでメモ。 round()は四捨五入をするわけではない 偶数への最近接丸め 言い換えると round()は厳密に偶数丸めをするわけではない 偶数丸めのアルゴリズムから予想される結果と数値計算の結果との…

「統計的に有意」だけでは足りないワケ:バイアス-バリアンス分解のはなし

機械学習の教科書には,序盤などに「バイアスとバリアンス」とか「バイアス-バリアンス分解」といった項目があります。「誤差にはバイアスとバリアンスの2種類があるよ」という話です。正直私はそれを読んでも「ふーん。まぁ,そうだよね」と思うくらいで…

ディスプレイは2~3個あると作業が捗る説

今年に入ってからディスプレイの数を1台から2台へ,2台から3台へと段階的に増やしました。 その結果,すごく作業が捗るようになりました。仕事でも遊びでも。 世の中には「ノートPCひとつあれば十分」という方も多いとは思うのですが,私の体験を述べてみた…

メモ用アプリは結局Typoraが一番良かった

以前,自分に一番合うメモ用のテキストエディタを探したときのことを書きました。 nigimitama.hatenablog.jp この頃は「それぞれのアプリに一長一短あるのでどれがいいのかな~」と思っていたのですが,結局その後一番使っているのはTyporaでした(以前の記…