自称・統計家 (@biostat0718) 's Twitter Profile
自称・統計家

@biostat0718

駆け出しの生物統計家 / 看護師・保健師 /
臨床研究 / 治験 / MPH(Master of Public Health) / 公衆衛生大学院 / SAS, Rユーザー / 備忘録として日々の学びや気付きをつぶやく

ID: 1453257641082462212

calendar_today27-10-2021 07:10:18

143 Tweet

238 Takipçi

225 Takip Edilen

高橋将宜 Masayoshi Takahashi (@m123takahashi) 's Twitter Profile Photo

【誤差項の正規性1/3】 リンク先の記事について、残差を丁寧に確認することが大事という趣旨自体は正しいと思いますが、全体的には不正確だと思います。「回帰分析の前提」として挙げられている「正規性(誤差自体が正規分布している)」は、ガウス・マルコフの前提には含まれません。小標本における統

高橋将宜 Masayoshi Takahashi (@m123takahashi) 's Twitter Profile Photo

母集団におけるyとxの関係をy=α+βx+εとし,標本におけるyとxの関係をy=a+bx+eとします.εを誤差項,eを残差と呼ぶとします.母集団データは観測不可能で,標本データは観測可能とします.このとき,誤差項εの正規性は観測できない仮定で,残差eの正規性は観測できる事実で仮定ではないですね.(1/2)

高橋将宜 Masayoshi Takahashi (@m123takahashi) 's Twitter Profile Photo

「経験的に目的変数が正規分布してたら誤差も正規分布してることが多い」という資料には,問題点が2つあります.第一に,y=a+b1*x1+b2*x2+eで,x1は一様分布,x2は正規分布とします.左図のeは正規分布で,右図のeは一様分布ですが,どちらも目的変数yは正規分布に見えて,区別できません.(続く)

「経験的に目的変数が正規分布してたら誤差も正規分布してることが多い」という資料には,問題点が2つあります.第一に,y=a+b1*x1+b2*x2+eで,x1は一様分布,x2は正規分布とします.左図のeは正規分布で,右図のeは一様分布ですが,どちらも目的変数yは正規分布に見えて,区別できません.(続く)
黒木玄 Gen Kuroki (@genkuroki) 's Twitter Profile Photo

#統計 正確な説明にこだわっているようなのであえてコメント。 線形回帰でこだわるべき条件は「残差が正規分布」よりも「残差が独立同分布」の方です。 残差が非正規分布のi.i.d.のときの線形回帰は、非正規母集団のt検定と同じようにうまく行ったり、行かなかったりします。詳しい解説に続く。

高橋将宜 Masayoshi Takahashi (@m123takahashi) 's Twitter Profile Photo

確かに佐藤先生のおっしゃるとおり,誤差項の正規性を確認する場合には,残差の分布を図で視覚的に判断することが推奨されますが,小標本の場合,視覚的な判断には迷いが生じることがあります.(1/3)

Journal of Epidemiology (@j_epidemi) 's Twitter Profile Photo

#J_Epidemi Most viewed on J-Stage (Feb. 2023): BMI and cardiometabolic traits in Japanese: a Mendelian randomization study Mako Nagayoshi et al. doi.org/10.2188/jea.JE… Journal of Epidemiology

#J_Epidemi
Most viewed on J-Stage (Feb. 2023): 

BMI and cardiometabolic traits in Japanese: a Mendelian randomization study

Mako Nagayoshi et al.

doi.org/10.2188/jea.JE…
<a href="/J_Epidemi/">Journal of Epidemiology</a>
佐々木 敦朗 (@atsuosasaki1) 's Twitter Profile Photo

【ChatGPT4.0による査読レポート作成】 論文査読はコミュニティの一員として大事な仕事だが、ほぼボランティアである。他の仕事がある中、なるべく短時間で、質のよいレポートを作成したい。 ChatGPTは初心者ながら、以下の方法で時間短縮でき質も高くなった。英語論文作成にも応用できると思う。

さくら🌸医療統計・データサイエンス (@sakura_med_dsci) 's Twitter Profile Photo

この疑問の直接的な答えにならないかもしれませんが、 もしR等を使える方はシミュレーションしてみると感覚的な理解が得られるのでお勧めです🌈 「有意差なし→サンプルサイズを増やす」とαエラーが増えることが分かります。 以下コード付きで解説してみますね。

Tomohiro Shinozaki (@she_knows_a_key) 's Twitter Profile Photo

アウトカム回帰モデルのIPW推定、つまり傾向スコアの重み付け+回帰モデルで同時に共変量調整することの二重ロバスト(DR)性について (1/4)

自称・統計家 (@biostat0718) 's Twitter Profile Photo

現在の科学研究は新規性が重視されるが、ひとつの研究結果だけでは不確実性が伴う。 不確実性を減らすためには、複数の研究とそれらのメタアナリシスが必要。 再現研究の重要さについて、ジャーナルや査読者、研究者は再認識すべき。 よし、新規性に囚われすぎず意義のある研究をするぞ。

KRSK (@koro485) 's Twitter Profile Photo

データ分析を教えるのに便利なデータ集。因果推論だと、見かけ上は同じ関連をもつ交絡、collider、媒介、Mバイアスのシミュレーションデータ。 r-causal.github.io/quartets/

Sato Shuntaro|佐藤俊太朗 (@shuntarooo3) 's Twitter Profile Photo

査読者から「(RCTの)Table 1にP値出してー」「事後的なサンプルサイズ計算してー」「正規性がー」「ステップワイズー」とか困ったこと言われたときのディフェンス論文がまとまっているサイト