はじめに
更新が大変滞っており2ヶ月ぶりの更新です。申し訳ありません。
前回の記事です。
syleir.hatenablog.com
基本的な考え方について解説しました。
このパートでは生存時間解析において数理的な解析をする時に重要な概念である生存関数、ハザード関数について整理しておきます。
生存関数、ハザード関数の理解なくして生存時間解析の理解はありません。大変ですが、内容は高校数学程度なので頑張りましょう。
前提知識の確認
すでに十分な理解がある方は適宜飛ばしてください。
ハザード関数
ハザード関数は被験者が時刻まで生存したもとでのその瞬間の死亡の多さを定量的に表したものです。注意すべきなのは確率ではないため、1を超えることもあります。
定義は、
です。つまり、 がからまでの間の死亡確率を表しています。
ここで、極限の中身の分子を上の条件付き確率の定義に従って式変形すると、
です。2行目から3行目の式変形については、数直線を書けば(書かなくても)自明ですが、
という条件は を完全に包含していますから、
なので成り立ちます。
以下が連続であれば、この変形を利用すれば、
となります(微分の定義)。この式から、はから導くことができます。
したがって、の累積ハザード関数としてを定義すれば、からを計算でき、それを微分することでが計算できることになります。
これで、とが相互変換可能であることがわかりました。
当然、とからはも計算できます。
練習問題
と、が相互変換可能であることを利用していくつか計算問題をやってみましょう。
例題1
の時、, は?
なので
例題2
の時、, は?(指数分布)
なので
例題3
の時、は?(パレート分布)
または
例題4
の時、は?(ワイブル分布)
以上を通じて、相互変換可能性というものがお伝えできたでしょうか。
かなり恣意的な関数が例題に上がっていますが、積分不可能であったりする関数も世の中には多いためです。そういう時はコンピュータシュミレーションで頑張りましょう。
ハザード関数の意義
では、相互変換可能なのであれば、どうしてハザード関数を用いるのでしょうか?
もともとの確率密度関数f(x)や、生存関数S(x)を使った方がわかりやすいのではないでしょうか?
本章ではハザード関数がなぜ存在するかを説明していきます。
視覚化としての意義
もちろん生存関数をグラフ化してもどこでたくさんイベントが起こっているかはわかりますが、ハザード関数として描出した方が、時間あたりのイベントの起こりやすさが可視化しやすいです。生存関数を見せられるよりは、イベントがどのタイミングで起こりやすいのかを見せた方が、人間は理解しやすいです。
おわりに
少しヘビーになってしまいました。凖1級の勉強としてはここまで、あるいはこの次までで良いと思います。
次回以降は具体的な応用、カプランマイヤー曲線について話したいと思います。
次回記事です。
syleir.hatenablog.com