morのブログ さん プロフィール

  •  
morのブログさん: morの推定勉強
ハンドル名morのブログ さん
ブログタイトルmorの推定勉強
ブログURLhttp://moruke.muragon.com/
サイト紹介文推定を自学.手計算・Rで実感するブログ. 疫学、リスクアセスメントも.
参加カテゴリー
更新頻度(1年)情報提供100回 / 365日(平均1.9回/週) - 参加 2016/05/08 18:08

morのブログ さんのブログ記事

  • ヒアリ~メキシコ豚Fluの轍
  • ・ ヒアリが咬むことで、体内に、或るもの:アルカ口イド系:が入り込むことにより、ショック等を起こす恐れがあり、問題となっている. ・ ヒアリが全くいない、あるいはすべて駆除することが保証できない場合、ヒトはエピペンを持ち歩き、いつでも打てるようにするしかないのではないか. ・ ヒアリの危険を避けるには、接触しないことが一番なのだろうが、メキシコ豚Fluの例にするまでもなく、食い止めるのは大事、しか [続きを読む]
  • Pμプルト二ウム
  •  防護半面マスクを通過して、吸引され、体内にくっついた?件.  カンの蓋が圧で浮いたが蓋をとった? なぜ?ふつうは、異常に気付き、作業を止めるはず.  中のビニール袋をガスが満たしていた.何のガス? α崩壊したのならヘリウム?  「アルファ粒子はヘリウム原子として結晶中に閉じ込められるので、金属中にヘリウムの気泡(直径 1 nm程度)が生じる。これは時間とともに増えていくため膨れを生じるものの、無 [続きを読む]
  • カンピロバクター食中毒
  •  またか・・・.  その”菌が、腸管内にいる可能性が高い”とか、いうが、水もまたこれまで何度もその原因となってきた.食中毒の原因としていまやトップに君臨するこの食中毒に対してはわきが甘い.ジャガイモの毒と同レベル、危険を知らずに曝露させる側の過失が問われそうだ.  これは、「[新潟県は5日、妙高市猪野山の山中で、わき水を飲んだ小学生とその家族43人が発熱や下痢などの症状を訴え、12人からカンピロバ [続きを読む]
  • 工学的なモデル解説>疫学的なモデル解説
  •  推定やモデリングの解説を探していると、内容が工学的な本や文献(ネット上)の数は、疫学的・生物学的なそれよりはるかに多い.おそらく時勢も反映している.著者の専門分野によって(テーマ、)解説に使用する用語から記号に至るまでことごとく異なる.経済学でも推定が扱われているが、工学、数学寄りである.疫学的、生物学的なものは、遺伝に関するものを除けば、近い関係にある気がするし、現象の観察、記述から理論が抽象 [続きを読む]
  • 超幾何分布から信頼下限を決める 加筆+微修正
  • ・ 2×2表を超幾何分布から考える.  2×2表では、生起因子曝露に対する観察発生数 94ほか(観光船事例)4つの数値が得られる.  事例のなかで、発生数m、暴露数(抽出数)k、非発生数nの3つの数値があれば、超幾何分布を用いて、抽出数に応じた、起こるべきばらつきを再現できる.  生起因子についてヒストグラムをながめると、この事例では発生率がほぼ0.5にあるため、ばらつきは左右同じ程度である.計算 [続きを読む]
  • 補足:MH法による調整値とglm推定によるOR比較
  • この記事は、以前の記事;MH法による調整値とglm推定係数の比較 について補足する. ・推定係数を+側にした ・推定係数とMHORの比較を自然にするため、推定係数をexpして図で比較した. ・推定に用いたモデルは、以前の記事とは異なる.   [続きを読む]
  • 最尤推定に含まれる推定率和の保存性
  •  最尤推定は、別記事に記載のとおり、ロジスティック回帰において、推定値からなる確率は推定関数となって現れる.  一方、事例に一定の発生者があり、事例全体の発生率(null modelの切片)が決まり、モデルによる推定をするとき、ある曝露因子有無による発生Oddsなどを拘束しているはずで、各員の確率和が全体発生率に一致するのは自明な必要と思われる.  そこで、推定関数を見直すと、積率から導出されたこ [続きを読む]
  • メモ:seが大きい
  • ・Rが推定する係数のse  数~10前後の因子についてglm logistic回帰をして係数を得る.x1が生起因子とわかる.  因子をこれ1つとしたモデルをつくり、seなどを比較する.  8因子モデル   x1   se   切片   se   AIC              0.679   -2.55  0.735  266.58   単純化model   x1   [続きを読む]
  • 「機械学習のための確率と統計」著:杉山氏
  •  著:杉山将 発行:講談社 、2015第1刷.  機械学習プロフェッショナルシリーズという謳い文句であり、統計本としてはどちらかいえば、すぐに手に取ってみるほうのタイトルではなかった.がしかし、書店で中をみて斬新な感覚を覚えた.morとしては、目新しい数式も多く、いつかは役立つはずと購入.  数式が豊富で見やすい.簡潔なmemoがあり、興味をそそる.  現在は、この本の内容を追って計算をしてい [続きを読む]
  • ロジスティック回帰モデル 改
  •  logistic回帰モデルを扱った際、係数の現れ方について気付いたことをメモする.この記事はモデルの一般的な説明を意図しない.  ある事例の平均発生率はロジスティック関数を使って、下式(1)のように表せる.βnはNull modelにおける推定係数であり、同時に事例の発生オッズのlnでもある.                              ・・・(1)                 [続きを読む]
  • 固有値の疫学的試用:観光船事例
  • ■ 具体例   ■「観光船」事例を題材とする.この事例は、因子数も豊かで生起因子のほか、みかけの因子、抑制因子が含まれる.コホートとみなせる集団に起こった、後ろ向き研究の格好のデータであり、当ブログでたびたび取り上げている.  比較のため、因子ごとに2×2表マスターテーブルをつくり、cludeOR、MH要約OR、推定モデルからの推定係数を計算しておく(MHORは一層).固有値、detとの関連につい [続きを読む]
  • 固有値の疫学的試用:シュークリーム事例
  • ■ この記事で試すリスク推定値は固有値である.  固有値の小さい方(以下、単に固有値という)をリスクと対応させることができることを例題データを使って示す.  従来の解析方法による結果と比較する. ■ 固有値の、影響度判定力の検討 ・シュークリーム、カフェラテの例題で交絡と固有値の関係をみる.     粗表        シュー カフェラテ           OR    6     3.93  [続きを読む]
  • おもちゃ:det・固有値をリスク値とみなす
  • ■ 行列のdet、固有値(習ったハズ).  a-dからなる表を行列とみて、リスクとの対応を調べる. この行列の固有値を調べる. ■ det をリスクと対応させるアイデア  因子ごとの2×2表を行列としてみれば、    det = ad-bc  a/cを曝露群発症オッズ、b/dを対照群発症オッズとして、      ad 〉bc のとき、 a/c 〉 b/d :曝露群側にリスクあり       [続きを読む]
  • 感染症と食中毒 生起因子を含むglm鑑別
  • ■ この記事(ブログ)では”感染症”を”食中毒以外の感染による事例”とする.コホートとみなせる集団で、発生時期が近接し、時間的にグループ分けせず、単一暴露な事例を想定して考える.  glmを用いて食品のメニューを因子としたモデルをベースにすれば、試行しやすい. ■ モデリングに感染機会因子が含まれる場合. ・感染の機会(特定の室利用、既知感染者との接触など)を因子として調査した場合は、モデリングに [続きを読む]
  • より尤もらしいモデル
  • ■ 要約  同じデータからいろいろなモデルをつくり、得られる推定値を並べるとき、また、作った1つのモデルの推定値は、はたして正しいのか漠とした不安をもつ.観察した発症率や、コントロールグループの発症率と似つかわしい値を示すモデルが尤もらしい.正しいモデルを見極め、またgamによって作り出す方法を考える. ■ アイデア  因子の少ないモデルで起こる代償性変化は、切片、係数ともに無視できない.  デー [続きを読む]
  • 感染症と食中毒~鑑別方針
  •  ”食中毒を起こしうる病因”が、食品以外の経路で感染し、起こす事案も感染症だが、食品による感染から起こる事案もそれは感染症であろう.  ここでは、食品以外の経路で感染する場合を感染症としておく.  感染症と食中毒を解析疫学に沿って数理的に区別することを考える. 1 潜伏時間  曝露時点から感染源を特定できない.潜伏時間は重複し得る. 2 地理的分布  感染する場所からも感染源の違いを区別し得ない. [続きを読む]
  • モデル因子の削減によるdevianceへの影響
  • ■ glmの係数はモデルに取り込まれる因子の曝露重複状況が推定結果に反映され、因子削減したモデルでは、係数が大小する(代償性変化:過去記事で詳述した).  因子を削減したモデルたちについてdeviance、AICを観察すると、新たなモデルの因子係数ばかりかAICも影響されている:下図.  図で 横軸は元:因子を削減しないモデル、-1:因子を1つ削減したモデル、以下同様に削減数を割り振る.縦軸はde [続きを読む]
  • 対数尤度の分布(Rと手計算)
  • ■ 対数尤度;ロジスティック回帰でのそれは、    ln? = 対数尤度; Σxiβyi - Σ ln (1+exp(xiβ))  ・・・・ 1 とおける.  deviance とは、 -2ln? のことであり、Rで推定したcoefficientをデータに戻して、手計算する.個々の尤度を総和したものは、モデルのdevianceと一致するはずである.  ■ データをいつもの観光船事例からとって実証 [続きを読む]
  • gam係数の因子による変化
  • ■ GAMにおける因子影響  gamにおいても、因子の削除により、他の因子推定係数が影響を受ける.これはgamがglmの拡張であるから当然である.(glmにおける因子の代償性変化は、すでに記事にした.)  また、平滑化係数を変化させると平滑化因子の曲線と線形因子の推定係数とが変化する. ■ 平滑化因子・交互作用項が設定された具体的なモデルではどうなるか.  平滑化因子は、交互作用項を設定したとき、 [続きを読む]
  • 改:説明変数と目的変数を入れ替える
  • ■ 結果yが、原因と密接な関連を持つxにより説明されるかを調べるのは、”ふつう”のモデリングである.だがxが、むしろyの原因としても不自然でない場合があり、因子と結果をモデル内で入れ替えた際に何が起こるか、興味が湧いた.  推定係数とORについて復習しながら手元のデータでこれを調べた.  結果、yとx:原因/結果を入れ替えた場合、入れ替わって因子としたyの推定値とほぼ一致した.これは生起因子のO [続きを読む]