盆暗の学習記録

データサイエンス ,エンジニアリング,ビジネスについて日々学んだことの備忘録としていく予定です。初心者であり独学なので内容には誤りが含まれる可能性が大いにあります。

データ可視化

seabornのkdeplotでhue引数を使うときはcommon_norm=Falseを検討しよう

TL; DR seaborn.kdeplotでクラスごとに分布を描くとき、デフォルト引数のままだとクラスごとのサンプル数が違うと分布の大きさも違ってしまう kdeplotではデフォルトではcommon_norm=Trueになっており、全クラスの分布の面積の合計が1になるように分布が調整…

Plotlyで地図上に散布図を描く

ドラッグしたりズームできるようなマップ上に散布図などを描きたいとき、FoliumだけでなくPlotlyも使えることを知ったのでメモしておきます。 環境 python:3.11のDocker Imageの下で、以下のバージョンのライブラリで試しました。 jupyterlab==4.0.10 plotly…

[R]summarytoolsパッケージがデータをざっくり見るのに便利そう

タイトル通りです。なんか便利そうなの見つけたので何ができるか簡単にメモしておきます メソッド紹介 {summarytools}はRにおいてデータの要約統計量や分布などを簡単に一覧で見られるメソッドたちを提供するパッケージです。 freq() 度数分布表を出してくれ…

pythonで塗り分け地図を描く

geopandasによる基本的なplotの例示

[WSL Ubuntu]pythonで塗り分け地図を描くための環境構築

Ubuntuへのgeopandasというライブラリのインストールまでの流れと、塗り分け図のプロットの例を書いていきます。 私のPCの環境について WindowsですがWSLを使います。 windows 10 ver.1903 WSL1 Ubuntu 18.04 geopandasのインストール windowsへのインストー…

使用を避けるべきグラフ

最近グラフつくってて思ったことをメモ 円グラフを使わない 帯グラフもあまり良くないかも 参考:グラフづくり全般で参考になる記事 (参考)記事中のグラフのコード 円グラフを使わない 「円グラフわかりにくいから,棒グラフを使え」という話です(人間は…

[R]BBCニュースで使われるグラフを描く{bbplot}パッケージ

BBCニュースで使われるグラフのスタイルを再現する{bbplot}というパッケージの存在を知りました github.com ちょっと使ってみたいと思います。 インストールと実行 Windowsだと警告がでる 折れ線グラフ 棒グラフ まとめ 参考 インストールと実行 ggplotのテ…