データ分析な日々 (@data_everyday) Twitter Tweets • TwiCopy

データ分析な日々

@data_everyday

2 years ago

excel が空欄を0と見做すおかげで、excel で計算して作られた特徴量にはしばしば0擬態ステルス欠損値が潜んでいる

thumb_up_off_alt4

chat_bubble_outline0

repeat0

shareShare

タランチュラ | データサイエンティスト

@tarantula_ds_

2 years ago

【次元削減手法まとめ】次元削除手法をみんなはいくつ知ってる？🤔 代表的な次元削除手法をまとめたよ！ ☑️LDA ☑️t-SNE ☑️PCA ☑️UMAP 各手法ごとに特徴があるから、ぜひ概要をチェックしてね👍

thumb_up_off_alt46

chat_bubble_outline0

repeat5

shareShare

データ分析な日々

@data_everyday

2 years ago

主成分分析って正規分布仮定してる？古いけどこちらにも書いてある（”前提”って記載）んだけど、正規分布の仮定でPCAのどの性質や計算が導かれてるか分からんです ism.ac.jp/editsec/toukei…

thumb_up_off_alt30

chat_bubble_outline1

repeat2

shareShare

データ分析な日々

@data_everyday

2 years ago

よくありそうな設定だしささっと読んどくか、って買って非心系の分布に打ちのめされた＆何回も読み返してるこいつが頭に浮かぶ

thumb_up_off_alt261

chat_bubble_outline0

repeat22

shareShare

データ分析な日々

@data_everyday

2 years ago

Python ではじめるグラフィカルモデル

thumb_up_off_alt4

chat_bubble_outline0

repeat0

shareShare

データ分析な日々

@data_everyday

2 years ago

これ言う人は見たことないけど、「DS の人らはすぐ Python いじっちゃう」と言い超速でExcelで前処理なり可視化なりする人なら見たことがある

thumb_up_off_alt2

chat_bubble_outline0

repeat0

shareShare

データ分析な日々

@data_everyday

2 years ago

notebook はその名の通り、ある程度見せる結果が決まってて、それをノートにまとめる（tutorial とかその典型）って使い方ならわかる

thumb_up_off_alt1

chat_bubble_outline0

repeat0

shareShare

データ分析な日々

@data_everyday

2 years ago

話題の微積分+線形代数本、「なんとしても理解させる」という強い意志を感じる

thumb_up_off_alt0

chat_bubble_outline0

repeat0

shareShare

データ分析な日々

@data_everyday

2 years ago

球面集中現象初めて知ったんだけど、多次元になると超球の体積のうち表面付近の体積がほとんどの割合を占めるから、ランダムに発生させた高次元ベクトルは必然的に球の表面付近に分布するって話なのかな

thumb_up_off_alt0

chat_bubble_outline0

repeat0

shareShare

データ分析な日々

@data_everyday

2 years ago

題名の割にスパース推定あんま出てこないけど、JMRA の面白そうな活動 jmra-net.or.jp/Portals/0/comm…

thumb_up_off_alt1

chat_bubble_outline0

repeat0

shareShare

データ分析な日々

@data_everyday

2 years ago

”線形回帰で多重共線性がある場合、一般逆行列でも解決できるけど、スパース推定で一般逆行列は利用されてないのはなぜ？”（JMRA内容の意訳）縮小推定すれば少なくともパラメタ推定できるって意味で多重共線性の問題はないのでその発想はなかったけど、うーん、擬似逆行列で置き換える必要がない？

thumb_up_off_alt1

chat_bubble_outline0

repeat0

shareShare

データ分析な日々

@data_everyday

2 years ago

cursor でコード生成したら日本語で変数定義し始めた

thumb_up_off_alt2

chat_bubble_outline0

repeat0

shareShare

データ分析な日々

@data_everyday

2 years ago

カーネルいじってガウス過程をうねうねさせて遊べるサイト見つけた smlbook.org/GP/

thumb_up_off_alt332

chat_bubble_outline0

repeat33

shareShare

データ分析な日々

@data_everyday

2 years ago

定義通りの変化率xは、log(1+x)のx=0周りの線形近似なので、図の通り変化率が0から離れると対数差分の変化率は負の方向に偏るという理解です。 1枚目：近似の様子 2枚目：変化率が0から離れるとどう乖離するか

thumb_up_off_alt6

chat_bubble_outline1

repeat0

shareShare

データ分析な日々

@data_everyday

2 years ago

脂質とカロリーの信頼区間が広すぎる。サンプルサイズを大きくして再調査願います。

thumb_up_off_alt7

chat_bubble_outline0

repeat1

shareShare

データ分析な日々

@data_everyday

2 years ago

話題のSVM（Stochastic volatility model）のいい感じの資料を置いておきます。 diposit.ub.edu/dspace/bitstre…

thumb_up_off_alt4

chat_bubble_outline0

repeat0

shareShare

データ分析な日々

@data_everyday

a year ago

MultiOutputRegressor() って渡したモデルを単純に並列計算で独立に推定してるだけなのか別に全部の目的変数に対して同じモデルを使う必要もないしなぁ

thumb_up_off_alt1

chat_bubble_outline0

repeat0

shareShare

データ分析な日々

@data_everyday

a year ago

caret::findLinearCombos()、1行で完全な従属関係を全部洗い出してくれる、、

thumb_up_off_alt0

chat_bubble_outline0

repeat0

shareShare

データ分析な日々

@data_everyday

a year ago

Always use \top

$Always use \top$

thumb_up_off_alt6

chat_bubble_outline0

repeat0

shareShare

データ分析な日々

@data_everyday

a year ago

「ほぼ完璧に予測できました」には「data leakage」でほとんど正解

thumb_up_off_alt4

chat_bubble_outline0

repeat0

shareShare