Syleir’s note

2020.4.1より統計検定やE資格の勉強の進捗を報告しています。統計検定準1級、E資格、G検定取得しました!当ブログへのリンクはご自由にどうぞ。

MENU

【Part1】統計検定準1級•1級 生存時間解析のまとめ【過去問の分析・出題内容・勉強法】

はじめに

統計検定準1級のメインテーマと言えるかはわかりませんが(そもそも範囲が膨大すぎてメインテーマなんてないのかもしれません)、今日は生存時間分析について扱っていきたいと思います。
統計検定準1級のバイブルといえば

ワークブックですが、なぜか生存時間分析だけ謎の亜空間に閉じ込められています(第2章、確率分布の中に記載があります)。確かに出題頻度としては低いのですが、なんとか救い出して体系的に整理したいと思ってこの記事群を作成します。

また、1級では統計応用、医薬生物学のメインテーマになります。
今回は凖1級としては十分レベル、1級を6割程度カバーするレベルまでの生存時間解析の初歩を、試験対策という観点からまとめていきたいと思っています。

敵を知る

科目としての性質

生存時間解析は統計検定2級に登場しない新概念で、新しく勉強することが必要になります。言葉の定義、数式の意味、なぜこのようなものを定義するのかを大事にすることが効率の良い学習に繋がった体験があり、一方で高校数学程度の確率、微積分の知識があれば、統計検定準1級くらいの問題は難なくクリアすることができます。

出題範囲表

さて、ありとあらゆる試験対策をするとき、どのような位置付けでその範囲が出題されているのかを常に考慮する必要があります。

引用:統計検定Hp
驚くべきことに、統計検定準1級における出題範囲の定義としては確率分布と母関数のコーナーに細々と存在しているだけなのです。
ということで、ワークブック上もこれに則って確率分布の一種としての紹介にとどまるわけです。
体系的に整理する必要がないのもわかりますね。

ついでに1級の出題範囲も見てみましょう。

1級においては統計数理では統計検定準1級と同様に確率分布と母関数のコーナーに位置付けられていること、
統計応用の医薬生物学分野で生存時間と繰り返し測定という分野でまとめられていることがわかります。

過去問での出題状況

さて、過去問での出題状況を確認してみましょう。具体的な出題内容に関しては実際の過去問を参照してください。
2014年 1級 統計応用 医薬生物学 問4
(1)確率密度関数が与えられた状態からの各関数の導出(2) カプランマイヤー曲線の作成(3) 尤度関数(打ち切りあり)

2015年 1級 統計応用 理工学 問2
(1)ハザード関数の導出(2)生存関数の導出 (3)確率密度関数の計算 (4),(5)統計数理的問題

2016年 1級 統計応用 医薬生物学 問3
(1)カプランマイヤー曲線の作成(2)ログランク検定(3)ハザード関数の部分尤度

2016年 準1級 問8
(1)生存関数から確率密度関数の導出 (2) 確率分布、平均、中央値の計算(3)生存時間の中央値の計算

2017年 1級 統計応用 医薬生物学 問1
(1) ハザード関数の導出 (2) 累積ハザード関数の関係式の導出(3)-(5)統計数理範囲の計算問題(6)サンプリング

2018年 1級 統計応用 医薬生物学 (生存時間解析<統計数理的な問題)問1
(1)尤度関数(打ち切りなし) (2)尤度関数(打ち切りあり)(3)最尤推定量、フィッシャー情報量(4)デルタ法(5)計算

2019年 1級 統計応用 医薬生物学 問1
(1)カプランマイヤー曲線作成(2)Nelson-Aalen推定量の性質(3)境界内平均生存時間に関する問題(4)生存時間の分散(5)ハザードの最尤推定

2021年 1級統計応用 医薬生物学 問1
(1)ハザード関数の定義式から生存関数、確率密度関数の導出(2)カプランマイヤー曲線の作成(3)競合リスクの処理(4) 表の穴埋め(5)競合リスクの解釈

2022年 1級統計応用 医薬生物学 問1
(1)比例ハザード性(2)比例ハザードモデル(3)比例ハザードモデル下での性質(4)ハザード比の推定

といった感じです。ほぼ毎年何かしらで出題されています。
 

統計検定受験の到達目標

これらを踏まえて、
準1級の対策としては、生存時間解析は過去に1問しか出題はありませんので、生存関数などの数式的な定義を理解し、初歩の考え方を学ぶこと、それにより各関数が計算できるようになっていることで十分であり、
1級の対策としては、凖1級で求められているような、統計数理的な計算をするのはもちろん、カプランマイヤー曲線の作成、ログランク検定、ハザード比の推定、そして比例ハザードモデルの理解までが求められていることがわかります。
これは出題範囲として取り上げられているように、凖1級では確率分布と母関数の中にあり、計算を重視していること、1級では大分野となっており、生存時間解析そのものを理解してくださいというメッセージと私は理解しています。

公式本での取り扱い

準1級対策としては、ワークブックには例題を含めて問題の記載はありません。解説としても紙面5行で終了しています。1級対策としても公式本ではちょっとした解説はあるものの、数ページ程度の解説であり、なかなかこれで理解するのが難しいと思います。最近でた増訂版でも追加はありません。これが、統計検定における生存時間解析の理解を困難にしている要因です。

生存時間解析の勉強法は?

といったところで、今まで生存時間解析を試験勉強として勉強しようと思うと、生存時間解析の成書を読むしかないのでした。
よく使われているのは、

だと思います。前者は解説が冗長なのと、実装に重きを置いているので試験対策としては自分で情報を取捨選択する必要があります。(しかしわかりやすいです。おすすめです。)
後者は難易度がかなり高く、必要とされるレベルを大きく超えます。まだ自分も読み切れていないです。

個人的におすすめなのはこれですが、英語での出版しかなく、まだ和訳が出ていないです。しかし内容はかなり求められているものに近いと思います。

本記事の目標

ということを踏まえて、生存時間解析という、比較的求められていることがわかりやすい分野で、しかし対策がなかなか難しい、成書を1冊読むのはしんどいという方々へ向けた解説記事を書いていこうと思います。
シリーズを通して、凖1級レベルであれば前半までを読めばわかるように、全て読めば1級問題の前半までは解けるように書いていこうと思っています。
実際の実装はしないので、統計検定受けるつもりはないけど、概念を理解したい、という方にもおすすめです。亀のような更新頻度が想定されますが、よろしくお願いします。

次の記事

coming (as) soon (as possible)...