morのブログ さん プロフィール

  •  
morのブログさん: morの推定勉強
ハンドル名morのブログ さん
ブログタイトルmorの推定勉強
ブログURLhttps://moruke.muragon.com/
サイト紹介文推定を自学.手計算・Rで実感するブログ. 疫学、リスクアセスメントも.
参加カテゴリー
更新頻度(1年)情報提供72回 / 365日(平均1.4回/週) - 参加 2016/05/08 18:08

morのブログ さんのブログ記事

  • 個人影響分析(R)とバックグラウンド
  • ・解析では交絡が外にあることがむしろ多い.ブログの多くの記事でモデル推定係数の異常を調べたが、これと関係することなのだった.交絡が外にあれば、正しく調整できないから、推定結果は正しい保証がない.”交絡が外にあれば、推定したcoefficients(切片、因子)が、(例外を除いて)リスク値を上昇させる.この異常な状況でも、外にある交絡の大きさを計りたい.中規模例では(おそらく他の原因による)各因子の [続きを読む]
  • 調査しなかった因子の係数を点推定
  • □ モデリング推定から、調査しなかった生起因子の大きさを推定することが目標の1つであったが、モデルからでなく、粗な表から考えたらうまくいく. □ モデリングで起こる係数の異常、容れる因子の性質もヒントになった.記事 ”回帰モデルの係数が?になるわけ”において、コホートを前提に、モデリング上で  Ⅰ 推定係数は、モデルに取り込まれる因子に応じて変化するが、  Ⅱ 推定される係数には近似的な関係式を置 [続きを読む]
  • detはおもちゃでなかった
  •   2×2表を行列と扱ってdetを計算すると、あたかもリスク値のようにふるまうと気づいた. : 記事 おもちゃ”det・固有値をリスク値とみなす”.  ところが、非曝露群での発生率と暴露群の発生率を曝露状況で調整した差をabcdで表すと ad-bc を含んでいる.つまり1個人のcrudeなrisk differenceを表す式の分子そのものなのだった. [続きを読む]
  • 真理も細部に宿る
  •  躍進中の若手棋士の「感覚も多少あるが、”読み”によるところが大きい」という内容の発言に思うこと.  おそらく将棋は、採りうる手の数が多いから、大局観は広く必要だろうが、要所では”読み”が大事なのだろう.翻って自分について、ある計算をして、ちゃんとした結果なら、示す意味を考えるのだが、思い込みで計算した結果、見込み違いや、ミスで変な結果を得ることも多い.このとき、その間違いを”読み”なおすのが肝心 [続きを読む]
  • 双曲幾何と疫学推定(成分表示)
  • ・ 双曲線上のある点からk線(クライン円板にみたてた線)に射影されたものの x座標は、双曲線の座標s.uにおけるs座標の長さsで表せば、          また、x座標で表せば、                      これは、 tanh(φ) であるが、パラメータφをtanhの定義から成分で表せば                   φ = ln(s) [続きを読む]
  • 双曲幾何と疫学推定(対応)
  • ・ 疫学指標として、発生率、オッズ比、回帰推定係数がある.一方、logistic曲線は、双曲三角関数 tanh(φ)で表せる.ここでそのパラメータφと疫学推定との関係は、明らかにされていないようだ.双曲幾何と、疫学推定による値の数理関係を調べる. ・ s,u座標に双曲線 u=1/2s を描く.この線上の点 s,uをとる.  原点から接点への距離は1である.また、ある区間での双曲線の長さ l は、 [続きを読む]
  • 野生化した際に防除する体制とは何か?
  • ・ヒアリは、亜熱帯、温帯のこの国にも定着し得る、他のアリを駆逐するという性質がある. ・”野生化した”とき、防除する対策とは、拡大を防ぐため、棲息しがたい環境に変える、被害を防ぐためi咬まれた際の対策を準備する、といったものになるだろうか. ・駆除しようとしたら在来のアリもろとも消滅させることになろう.また、そのような毒性のある物質をまき散らせるのか疑問もあるし、そうでなくても自然をぼろぼろにする [続きを読む]
  • じゃがいも
  • ■ 愛知県豊田市で食中毒(?).責任者は誰だ? ■ 知らなければ恐ろしいということ ・ 農林水産 HPより :(小学校や家庭菜園などでのジャガイモ栽培)   ジャガイモ(いも部分)が地面から外に出ないよう、きちんと土寄せを。   十分に熟して大きくなったジャガイモを収穫。   収穫は、ジャガイモに傷を付けないよう。   収穫したジャガイモは、暗くて涼しい場所に保管。   (ジャガイモを乾かすために [続きを読む]
  • 岩波データサイエンス5
  • ・勝手に編集が消える機械、OS、変換システムなのだろう.頻繁なバックアップと再起動を余儀なくされる.それだからこそATOKをインストールせずにPC更新を続けるわけだが. ・さて、表題の本に、「交絡の調整のためにモデリングを使う」という引用があり、当ブログが試していることであり、そのセリフのようで、おどろいた. ・ GAMでいう過適合への罰則、GLMで行うstepによる因子選択の計算で世話になる基本 [続きを読む]
  • ヒアリ~メキシコ豚Fluの轍
  • ・ ヒアリが咬むことで、体内に、或るもの:アルカ口イド系:が入り込むことにより、ショック等を起こす恐れがあり、問題となっている. ・ ヒアリが全くいない、あるいはすべて駆除することが保証できない場合、ヒトはエピペンを持ち歩き、いつでも打てるようにするしかないのではないか. ・ ヒアリの危険を避けるには、接触しないことが一番なのだろうが、メキシコ豚Fluの例にするまでもなく、食い止めるのは大事、しか [続きを読む]
  • Pμプルト二ウム
  •  防護半面マスクを通過して、吸引され、体内にくっついた?件.  カンの蓋が圧で浮いたが蓋をとった? なぜ?ふつうは、異常に気付き、作業を止めるはず.  中のビニール袋をガスが満たしていた.何のガス? α崩壊したのならヘリウム?  「アルファ粒子はヘリウム原子として結晶中に閉じ込められるので、金属中にヘリウムの気泡(直径 1 nm程度)が生じる。これは時間とともに増えていくため膨れを生じるものの、無 [続きを読む]
  • カンピロバクター食中毒
  •  またか・・・.  その”菌が、腸管内にいる可能性が高い”とか、いうが、水もまたこれまで何度もその原因となってきた.食中毒の原因としていまやトップに君臨するこの食中毒に対してはわきが甘い.ジャガイモの毒と同レベル、危険を知らずに曝露させる側の過失が問われそうだ.  これは、「[新潟県は5日、妙高市猪野山の山中で、わき水を飲んだ小学生とその家族43人が発熱や下痢などの症状を訴え、12人からカンピロバ [続きを読む]
  • 工学的なモデル解説>疫学的なモデル解説
  •  推定やモデリングの解説を探していると、内容が工学的な本や文献(ネット上)の数は、疫学的・生物学的なそれよりはるかに多い.おそらく時勢も反映している.著者の専門分野によって(テーマ、)解説に使用する用語から記号に至るまでことごとく異なる.経済学でも推定が扱われているが、工学、数学寄りである.疫学的、生物学的なものは、遺伝に関するものを除けば、近い関係にある気がするし、現象の観察、記述から理論が抽象 [続きを読む]
  • 超幾何分布から信頼下限を決める 加筆+微修正
  • ・ 2×2表を超幾何分布から考える.  2×2表では、生起因子曝露に対する観察発生数 94ほか(観光船事例)4つの数値が得られる.  事例のなかで、発生数m、暴露数(抽出数)k、非発生数nの3つの数値があれば、超幾何分布を用いて、抽出数に応じた、起こるべきばらつきを再現できる.  生起因子についてヒストグラムをながめると、この事例では発生率がほぼ0.5にあるため、ばらつきは左右同じ程度である.計算 [続きを読む]
  • 補足:MH法による調整値とglm推定によるOR比較
  • この記事は、以前の記事;MH法による調整値とglm推定係数の比較 について補足する. ・推定係数を+側にした ・推定係数とMHORの比較を自然にするため、推定係数をexpして図で比較した. ・推定に用いたモデルは、以前の記事とは異なる.   [続きを読む]
  • 最尤推定に含まれる推定率和の保存性
  •  最尤推定は、別記事に記載のとおり、ロジスティック回帰において、推定値からなる確率は推定関数となって現れる.  一方、事例に一定の発生者があり、事例全体の発生率(null modelの切片)が決まり、モデルによる推定をするとき、ある曝露因子有無による発生Oddsなどを拘束しているはずで、各員の確率和が全体発生率に一致するのは自明な必要と思われる.  そこで、推定関数を見直すと、積率から導出されたこ [続きを読む]
  • メモ:seが大きい
  • ・Rが推定する係数のse  数~10前後の因子についてglm logistic回帰をして係数を得る.x1が生起因子とわかる.  因子をこれ1つとしたモデルをつくり、seなどを比較する.  8因子モデル   x1   se   切片   se   AIC              0.679   -2.55  0.735  266.58   単純化model   x1   [続きを読む]
  • 「機械学習のための確率と統計」著:杉山氏
  •  著:杉山将 発行:講談社 、2015第1刷.  機械学習プロフェッショナルシリーズという謳い文句であり、統計本としてはどちらかいえば、すぐに手に取ってみるほうのタイトルではなかった.がしかし、書店で中をみて斬新な感覚を覚えた.morとしては、目新しい数式も多く、いつかは役立つはずと購入.  数式が豊富で見やすい.簡潔なmemoがあり、興味をそそる.  現在は、この本の内容を追って計算をしてい [続きを読む]
  • ロジスティック回帰モデル 改
  •  logistic回帰モデルを扱った際、係数の現れ方について気付いたことをメモする.この記事はモデルの一般的な説明を意図しない.  ある事例の平均発生率はロジスティック関数を使って、下式(1)のように表せる.βnはNull modelにおける推定係数であり、同時に事例の発生オッズのlnでもある.                              ・・・(1)                 [続きを読む]
  • 固有値の疫学的試用:観光船事例
  • ■ 具体例   ■「観光船」事例を題材とする.この事例は、因子数も豊かで生起因子のほか、みかけの因子、抑制因子が含まれる.コホートとみなせる集団に起こった、後ろ向き研究の格好のデータであり、当ブログでたびたび取り上げている.  比較のため、因子ごとに2×2表マスターテーブルをつくり、cludeOR、MH要約OR、推定モデルからの推定係数を計算しておく(MHORは一層).固有値、detとの関連につい [続きを読む]
  • 固有値の疫学的試用:シュークリーム事例
  • ■ この記事で試すリスク推定値は固有値である.  固有値の小さい方(以下、単に固有値という)をリスクと対応させることができることを例題データを使って示す.  従来の解析方法による結果と比較する. ■ 固有値の、影響度判定力の検討 ・シュークリーム、カフェラテの例題で交絡と固有値の関係をみる.     粗表        シュー カフェラテ           OR    6     3.93  [続きを読む]
  • おもちゃ:det・固有値をリスク値とみなす
  • ■ 行列のdet、固有値(習ったハズ).  a-dからなる表を行列とみて、リスクとの対応を調べる. この行列の固有値を調べる. ■ det をリスクと対応させるアイデア  因子ごとの2×2表を行列としてみれば、    det = ad-bc  a/cを曝露群発症オッズ、b/dを対照群発症オッズとして、      ad 〉bc のとき、 a/c 〉 b/d :曝露群側にリスクあり       [続きを読む]