morのブログ さん プロフィール

  •  
morのブログさん: morの推定勉強
ハンドル名morのブログ さん
ブログタイトルmorの推定勉強
ブログURLhttp://moruke.muragon.com/
サイト紹介文科学的ということを手計算で実感するブログ. 疫学、リスクアセスメント
参加カテゴリー
更新頻度(1年)情報提供111回 / 324日(平均2.4回/週) - 参加 2016/05/08 18:08

morのブログ さんのブログ記事

  • 感染症と食中毒 生起因子を含むglm鑑別
  • ■ この記事(ブログ)では”感染症”を”食中毒以外の感染による事例”とする.コホートとみなせる集団で、発生時期が近接し、時間的にグループ分けせず、単一暴露な事例を想定して考える.  glmを用いて食品のメニューを因子としたモデルをベースにすれば、試行しやすい. ■ モデリングに感染機会因子が含まれる場合. ・感染の機会(特定の室利用、既知感染者との接触など)を因子として調査した場合は、モデリングに [続きを読む]
  • 感染症と食中毒~鑑別方針
  •  ”食中毒を起こしうる病因”が、食品以外の経路で感染し、起こす事案も感染症だが、食品による感染から起こる事案もそれは感染症であろう.  ここでは、食品以外の経路で感染する場合を感染症としておく.  感染症と食中毒を解析疫学に沿って数理的に区別することを考える. 1 潜伏時間  曝露時点から感染源を特定できない.潜伏時間は重複し得る. 2 地理的分布  感染する場所からも感染源の違いを区別し得ない. [続きを読む]
  • morのブログ目次 -2
  • ・  対数尤度の分布(Rと手計算)            cb もるである ・  モデル因子の削減によるdevianceへの影響  ・ 食中毒・感染症の鑑別     方針     生起因子を含むglm鑑別 :予定  [続きを読む]
  • モデル因子の削減によるdevianceへの影響
  • ■ glmの係数はモデルに取り込まれる因子の曝露重複状況が推定結果に反映され、因子削減したモデルでは、係数が大小する(代償性変化:過去記事で詳述した).  因子を削減したモデルたちについてdeviance、AICを観察すると、新たなモデルの因子係数ばかりかAICも影響されている:下図.  図で 横軸は元:因子を削減しないモデル、-1:因子を1つ削減したモデル、以下同様に削減数を割り振る.縦軸はde [続きを読む]
  • 対数尤度の分布(Rと手計算)
  • ■ 対数尤度;ロジスティック回帰でのそれは、    ln? = 対数尤度; Σxiβyi - Σ ln (1+exp(xiβ))  ・・・・ 1 とおける.  deviance とは、 -2ln? のことであり、Rで推定したcoefficientをデータに戻して、手計算する.個々の尤度を総和したものは、モデルのdevianceと一致するはずである.  ■ データをいつもの観光船事例からとって実証 [続きを読む]
  • gam係数の因子による変化
  • ■ GAMにおける因子影響  gamにおいても、因子の削除により、他の因子推定係数が影響を受ける.これはgamがglmの拡張であるから当然である.(glmにおける因子の代償性変化は、すでに記事にした.)  また、平滑化係数を変化させると平滑化因子の曲線と線形因子の推定係数とが変化する. ■ 平滑化因子・交互作用項が設定された具体的なモデルではどうなるか.  平滑化因子は、交互作用項を設定したとき、 [続きを読む]
  • 改:説明変数と目的変数を入れ替える
  • ■ 結果yが、原因と密接な関連を持つxにより説明されるかを調べるのは、”ふつう”のモデリングである.だがxが、むしろyの原因としても不自然でない場合があり、因子と結果をモデル内で入れ替えた際に何が起こるか、興味が湧いた.  推定係数とORについて復習しながら手元のデータでこれを調べた.  結果、yとx:原因/結果を入れ替えた場合、入れ替わって因子としたyの推定値とほぼ一致した.これは生起因子のO [続きを読む]
  • モデルの独立変数と従属変数の入れ替え
  • ■ 従属変数a,b,c,dに対して、応答変数flとして回帰モデルを組んだものとする.  因子dは、ときにflの発生に先んじて現れることがある.  因子a~dについて、係数β1~β3,βdが推定される. ■ ここで、応答変数flはまた、dに対しては、その原因と関連しうることが病因論からいえる.そこで、これらを入れ替え、新たなモデリングをする.  因子a~c,flに対して、dを応答変数としたモデルから [続きを読む]
  • 症例対照研究case-control study;CCS
  • ■ 大規模なデータの推定に際し計算コストの問題を避けるため、全データからなるコホート研究モデルから症例対照研究にスイッチする.いかに悪影響なくコントロールを減らせるか考える. ■ 症例対照のリスク値 ・症例を得て、すべてを症例群とし、暴露状況を調査する.絞った対照群を決めてその暴露状況とともに解析する. ・症例は、暴露因子の数だけ分けられ、対照群もまた暴露オッズをつくる.対照群はある程度の例数を要 [続きを読む]
  • 検定は後回しで推定を学ぶ
  • ・もとめるものは、”明瞭な結果”ではなく、すっきり割り切れないながらも何か ”あるらしい” ことの方である. ・検定は、ことを終わらせる間際の作法のようなものとすら思う.  推定をもって手探りをする.最尤推定を手にすれば、熱を発散させている方向が感じられる.何かありそうな予感をむやみに捨てずに済むのだ. ・あえて、モデルとデータの間に求めるものを探す.  過適合を避ける.データに束縛される必要はな [続きを読む]
  • 超幾何関数からCIを計算してみた Fisher'sExact test for CI
  • ・解析において、cross tableから OR、RRと近似による偏差から信頼区間を推定するが、それは、ふつう各群の数から計算される.そのため低率の事例では、ケースの小さな整数が信頼区間の結果をざらつかせ、信頼区間と超幾何関数からの確率を並べてみると、微妙に異なっていて、見栄えが悪い. ・そこで、得られた超幾何関数から、OR,RRの信頼区間を計算する式をつくってみた.  ORを例にする.      [続きを読む]
  • 低出現率な事例の解析
  • ・difuse outbreakならば、解析の始まりは症例の蓄積から・・となろう.  仮説をたてて、疫学調査に向かう. ・解析は、後ろ向きコホートか、後ろ向き症例対照かの、2とおりに括られようか.  症例対照の方は件数を節約できるが手間がかかるかもしれない. ・サンプル数  ごく低率な事例の場合、必要なサンプル数を下回るものが多数あると、どうもよろしくない率が出てくる.  「必要なサンプル数」とい [続きを読む]
  • 非線形・カテゴリカル変数の操作
  • ◆非線形性・名義  モデリングにあたって、そのパラメータと発生(結果)の分布をみると、例えば、時間に関連したパラメータによって結果が非線形になっていることがある.  gamによる方法もある.  しかし、glmでは、とくにすべての因子の係数を瞬時に取り出せて操作が楽だ.  このパラメータを操作して線形回帰に持ち込めれば、すっきりする. ◆パラメータの変換  ・時間的パラメータ xi     例 xi [続きを読む]
  • 非線形なパラメータ・大規模データ・交互作用モデリング
  • ◆ 中規模事例の後ろ向きコホートに続いて、  大規模やや複雑な後ろ向き研究.  決定的な因子が含まれない. ~調べるべきは、因子の効果、因子間の関係.  低発生率.  不完全な群が複数混じっている.〜もつれた事例になるりそう  従属変数は2値とカウントデータの2通り.〜とりあえず2値のものを扱う. ・解析方針  サンプルサイズが大きければ、pcのパワー、ソフトの処理時間が心配される.   〜暇があ [続きを読む]
  • Campy残存シミュレーションの裏付け RA8-2
  • ■ 工程によりcampy残存に違いが現れることを強調している.相互汚染を防ぐための区分処理や、塩素処理といった対策が効を奏しないことを認識し、そのうえで見逃されている他の工程管理法に注意を向けるべきと考えるからである.過去記事には、具体的に工程内汚染:鶏群における保有状況から、処理工程中に汚染が非保有鶏肉に及ぶことを問題とする視点に対しては、菌の数に着目すれば、危険度への関与が小さいことを指摘した [続きを読む]
  • 交絡と効果の修飾
  • ■ 交絡と効果の修飾は、いずれもみかけの効果を生ずる原因である. ■ 交絡は、リスクファクターの一つであって、注目するファクターとは別にあるものとし、効果の修飾は、注目するファクターの存在関与を前提として効果を増強・減弱するものとする. ■ それぞれの起こりやすさが、効果にどう関与するかを考える.  いずれも効果に対して+にはたらくものを考える.   生起因子による2×2表     曝露 非曝露 [続きを読む]
  • 調整が重視されない場合
  • ■ 調整の必要性  後ろ向き研究では、危険を示す指標値に含まれる、ゆがみ(交絡含む)が避けて通れず、「かならずある」としなければならない.ために粗指標を計算するや、直ちに調整を行って、ゆがみと本来の効果(と思しきもの)の大きさを切り離しておきたい. ■ 実際の不要性  しかし、急性事例についての種々報告では、これがあまり注目されていない.また、調整したところで、結果があまり変わらないといった経験も [続きを読む]
  • 増殖はしないcampy
  • ■ campyは、他のほとんどの食中毒菌と異なり、foodchainで増殖しないとみなされる. これは、campyの対策を考えるうえで、好都合であって、減ることに注意を向けてさえおけば、制圧のヒントが得やすい. [続きを読む]
  • 少数例におこる問題:抑制因子の例
  • ■ 少数例での事例解析上の問題をメモする.  因果関係を重回帰分析(多変量解析)で考えていくと、注目する因子のほかに、結果を抑制する因子を見出すこともある.また、疾病の抑制を問題にする薬品(がんと抗がん剤)、環境要因(野菜の喫食習慣)など、抑制する因子が注目すべき主役となることもある.それをサプレッサーという.  粗な方法でもサプレッサーと思しき因子が浮かぶ.また、同時に行う(のがよいと思うのだが [続きを読む]
  • GAM;一般化加法モデルのすすめ
  • ■ 線形回帰といいながら、glmでは、logistic回帰ができてかなり重宝なのだが、一部のパラメータを2値化してモデル化しても、因子の影響度を考えるときに情報が限られる. ■ gamは、glmを含んだ、より広い関数とみてよい.ただし、係数が取り出しがたい. ■ しかし、連続な変数を生かして(情報を損ねず)考察するためには、「こんな感じで関与している」という機能は貴重だ. ■ よって、gamは使用 [続きを読む]