morのブログ さん プロフィール

  •  
morのブログさん: morの推定勉強
ハンドル名morのブログ さん
ブログタイトルmorの推定勉強
ブログURLhttp://moruke.muragon.com/
サイト紹介文科学的ということを手計算で実感するブログ. 疫学、リスクアセスメント
参加カテゴリー
更新頻度(1年)情報提供118回 / 357日(平均2.3回/週) - 参加 2016/05/08 18:08

morのブログ さんのブログ記事

  • 回帰モデルの係数が?になるわけ
  • [要約] モデリングの推定過程で、非曝露群のリスクを決める係数(β。)と、曝露群のリスクを決める因子の係数(βi)は事例の平均発生率によって数理的に拘束されるが一意的でない.疫学的な規制を条件として加えると一意的に狭められる. [係数の拘束] ・係数の非一意性は、1因子の単純化した式(前記事)から、     β。+ βi = const のように近似しできる.これはシーソー関係のイメージである. [続きを読む]
  • ロジスティック回帰モデル
  •  logistic回帰モデルを扱った際、係数の現れ方について気付いたことをメモする.この記事はモデルの一般的な説明を意図しない.  ある事例の平均発生率はロジスティック関数を使って、下式(1)のように表せる.βnはNull modelにおける推定係数であり、同時に事例の発生オッズのlnでもある.                              ・・・(1)                 [続きを読む]
  • 固有値の疫学的試用:観光船事例
  • ■ 具体例   ■「観光船」事例を題材とする.この事例は、因子数も豊かで生起因子のほか、みかけの因子、抑制因子が含まれる.コホートとみなせる集団に起こった、後ろ向き研究の格好のデータであり、当ブログでたびたび取り上げている.  比較のため、因子ごとに2×2表マスターテーブルをつくり、cludeOR、MH要約OR、推定モデルからの推定係数を計算しておく(MHORは一層).固有値、detとの関連につい [続きを読む]
  • 固有値の疫学的試用:シュークリーム事例
  • ■ この記事で試すリスク推定値は固有値である.  固有値の小さい方(以下、単に固有値という)をリスクと対応させることができることを例題データを使って示す.  従来の解析方法による結果と比較する. ■ 固有値の、影響度判定力の検討 ・シュークリーム、カフェラテの例題で交絡と固有値の関係をみる.     粗表        シュー カフェラテ           OR    6     3.93  [続きを読む]
  • おもちゃ:det・固有値をリスク値とみなす
  • ■ 行列のdet、固有値(習ったハズ).  a-dからなる表を行列とみて、リスクとの対応を調べる. この行列の固有値を調べる. ■ det をリスクと対応させるアイデア  因子ごとの2×2表を行列としてみれば、    det = ad-bc  a/cを曝露群発症オッズ、b/dを対照群発症オッズとして、      ad 〉bc のとき、 a/c 〉 b/d :曝露群側にリスクあり       [続きを読む]
  • 感染症と食中毒 生起因子を含むglm鑑別
  • ■ この記事(ブログ)では”感染症”を”食中毒以外の感染による事例”とする.コホートとみなせる集団で、発生時期が近接し、時間的にグループ分けせず、単一暴露な事例を想定して考える.  glmを用いて食品のメニューを因子としたモデルをベースにすれば、試行しやすい. ■ モデリングに感染機会因子が含まれる場合. ・感染の機会(特定の室利用、既知感染者との接触など)を因子として調査した場合は、モデリングに [続きを読む]
  • より尤もらしいモデル
  • ■ 要約  同じデータからいろいろなモデルをつくり、得られる推定値を並べるとき、また、作った1つのモデルの推定値は、はたして正しいのか漠とした不安をもつ.観察した発症率や、コントロールグループの発症率と似つかわしい値を示すモデルが尤もらしい.正しいモデルを見極め、またgamによって作り出す方法を考える. ■ アイデア  因子の少ないモデルで起こる代償性変化は、切片、係数ともに無視できない.  デー [続きを読む]
  • 感染症と食中毒~鑑別方針
  •  ”食中毒を起こしうる病因”が、食品以外の経路で感染し、起こす事案も感染症だが、食品による感染から起こる事案もそれは感染症であろう.  ここでは、食品以外の経路で感染する場合を感染症としておく.  感染症と食中毒を解析疫学に沿って数理的に区別することを考える. 1 潜伏時間  曝露時点から感染源を特定できない.潜伏時間は重複し得る. 2 地理的分布  感染する場所からも感染源の違いを区別し得ない. [続きを読む]
  • モデル因子の削減によるdevianceへの影響
  • ■ glmの係数はモデルに取り込まれる因子の曝露重複状況が推定結果に反映され、因子削減したモデルでは、係数が大小する(代償性変化:過去記事で詳述した).  因子を削減したモデルたちについてdeviance、AICを観察すると、新たなモデルの因子係数ばかりかAICも影響されている:下図.  図で 横軸は元:因子を削減しないモデル、-1:因子を1つ削減したモデル、以下同様に削減数を割り振る.縦軸はde [続きを読む]
  • 対数尤度の分布(Rと手計算)
  • ■ 対数尤度;ロジスティック回帰でのそれは、    ln? = 対数尤度; Σxiβyi - Σ ln (1+exp(xiβ))  ・・・・ 1 とおける.  deviance とは、 -2ln? のことであり、Rで推定したcoefficientをデータに戻して、手計算する.個々の尤度を総和したものは、モデルのdevianceと一致するはずである.  ■ データをいつもの観光船事例からとって実証 [続きを読む]
  • gam係数の因子による変化
  • ■ GAMにおける因子影響  gamにおいても、因子の削除により、他の因子推定係数が影響を受ける.これはgamがglmの拡張であるから当然である.(glmにおける因子の代償性変化は、すでに記事にした.)  また、平滑化係数を変化させると平滑化因子の曲線と線形因子の推定係数とが変化する. ■ 平滑化因子・交互作用項が設定された具体的なモデルではどうなるか.  平滑化因子は、交互作用項を設定したとき、 [続きを読む]
  • 改:説明変数と目的変数を入れ替える
  • ■ 結果yが、原因と密接な関連を持つxにより説明されるかを調べるのは、”ふつう”のモデリングである.だがxが、むしろyの原因としても不自然でない場合があり、因子と結果をモデル内で入れ替えた際に何が起こるか、興味が湧いた.  推定係数とORについて復習しながら手元のデータでこれを調べた.  結果、yとx:原因/結果を入れ替えた場合、入れ替わって因子としたyの推定値とほぼ一致した.これは生起因子のO [続きを読む]
  • モデルの独立変数と従属変数の入れ替え
  • ■ 従属変数a,b,c,dに対して、応答変数flとして回帰モデルを組んだものとする.  因子dは、ときにflの発生に先んじて現れることがある.  因子a~dについて、係数β1~β3,βdが推定される. ■ ここで、応答変数flはまた、dに対しては、その原因と関連しうることが病因論からいえる.そこで、これらを入れ替え、新たなモデリングをする.  因子a~c,flに対して、dを応答変数としたモデルから [続きを読む]
  • 症例対照研究case-control study;CCS
  • ■ 大規模なデータの推定に際し計算コストの問題を避けるため、全データからなるコホート研究モデルから症例対照研究にスイッチする.いかに悪影響なくコントロールを減らせるか考える. ■ 症例対照のリスク値 ・症例を得て、すべてを症例群とし、暴露状況を調査する.絞った対照群を決めてその暴露状況とともに解析する. ・症例は、暴露因子の数だけ分けられ、対照群もまた暴露オッズをつくる.対照群はある程度の例数を要 [続きを読む]
  • 検定は後回しで推定を学ぶ
  • ・もとめるものは、”明瞭な結果”ではなく、すっきり割り切れないながらも何か ”あるらしい” ことの方である. ・検定は、ことを終わらせる間際の作法のようなものとすら思う.  推定をもって手探りをする.最尤推定を手にすれば、熱を発散させている方向が感じられる.何かありそうな予感をむやみに捨てずに済むのだ. ・あえて、モデルとデータの間に求めるものを探す.  過適合を避ける.データに束縛される必要はな [続きを読む]
  • 低出現率な事例の解析
  • ・difuse outbreakならば、解析の始まりは症例の蓄積から・・となろう.  仮説をたてて、疫学調査に向かう. ・解析は、後ろ向きコホートか、後ろ向き症例対照かの、2とおりに括られようか.  症例対照の方は件数を節約できるが手間がかかるかもしれない. ・サンプル数  ごく低率な事例の場合、必要なサンプル数を下回るものが多数あると、どうもよろしくない率が出てくる.  「必要なサンプル数」とい [続きを読む]
  • 非線形・カテゴリカル変数の操作
  • ◆非線形性・名義  モデリングにあたって、そのパラメータと発生(結果)の分布をみると、例えば、時間に関連したパラメータによって結果が非線形になっていることがある.  gamによる方法もある.  しかし、glmでは、とくにすべての因子の係数を瞬時に取り出せて操作が楽だ.  このパラメータを操作して線形回帰に持ち込めれば、すっきりする. ◆パラメータの変換  ・時間的パラメータ xi     例 xi [続きを読む]
  • 非線形なパラメータ・大規模データ・交互作用モデリング
  • ◆ 中規模事例の後ろ向きコホートに続いて、  大規模やや複雑な後ろ向き研究.  決定的な因子が含まれない. ~調べるべきは、因子の効果、因子間の関係.  低発生率.  不完全な群が複数混じっている.〜もつれた事例になるりそう  従属変数は2値とカウントデータの2通り.〜とりあえず2値のものを扱う. ・解析方針  サンプルサイズが大きければ、pcのパワー、ソフトの処理時間が心配される.   〜暇があ [続きを読む]
  • Campy残存シミュレーションの裏付け RA8-2
  • ■ 工程によりcampy残存に違いが現れることを強調している.相互汚染を防ぐための区分処理や、塩素処理といった対策が効を奏しないことを認識し、そのうえで見逃されている他の工程管理法に注意を向けるべきと考えるからである.過去記事には、具体的に工程内汚染:鶏群における保有状況から、処理工程中に汚染が非保有鶏肉に及ぶことを問題とする視点に対しては、菌の数に着目すれば、危険度への関与が小さいことを指摘した [続きを読む]