2015/12/13

【初心者向け企画】分析の初歩を学ぼう 第5回 多峰性のヒストグラム

先週、スタッフが多峰性ののヒストグラムを作ろうとして、年齢別の外来受療率の棒グラフを作ってしまった(【初心者向け企画】分析の初歩を学ぼう 第3回 多峰性のヒストグラム(実践的なヒストグラム作成の続き))が、失敗を恐れて何もしないより、失敗でも重ねた方が着実に経験を積むことができる・・・と言いたいところなのだが、「多峰性のヒストグラムはちょっとパス」ということなので、スタッフの代わりに分析事例を紹介したい(Masaru Watanabe)

関節リウマチの手術なし症例で、かつ処置2あり(生物学的製剤の投与・リハビリ・人工呼吸等あり)のDPC公開データ(2014年度実績)について分析した。

在院日数2日刻みでヒストグラムを作成した結果が下のグラフだ。
<関節リウマチ 手術なし 処置2あり>の施設別在院日数の分布
「2日以上4日未満(グラフ中は『2日以上』と表記)」が最も多く、それ以外にも「10日以上12日未満(『10日以上』と表記)」、「20日以上22日未満(『20日以上』と表記)」にピークが見られる。30日以上もピークのように見えるが、これは30日以上すべての施設が計上されているため、ピークと判断するには注意が必要だ。

多峰性のヒストグラム=「多峰性となる理由」が背景にある

ここからがヒストグラム分析の面白いところだが、多峰性になるときには大抵何らかの理由がある。答えから先に言ってしまえば、病院によって、入院内容が大きくことなるためである。

3日以内の短期入院の多くは、生物学的製剤の投与入院であり、それなりのリスクを伴う治療のため、入院し経過をみるケースだ。一方で10日程度では、自己注射の導入教育入院や、リハビリ教育入院を主体とした病院である可能性が考えられる。リハビリ入院では3週間前後が最も多いはずであり、その比率が高い病院は、平均在院日数が長くなる。

このような「多峰性になる背景」は、別の資料からも読み解くことができる。それは参考資料2で公開されている『(6)診断群分類毎の集計』である。


この関節リウマチの手術なし処置2ありのDPC公開データ上は、同じグループで扱われてしまっているが、実際には様々な症例が混じっていていることが分かる。

トシリズマブやアバタセプト、インフリキシマブであれば、在院日数の中央値が2日か3日と非常に短い一方で、アダリムマブでは7日、リハビリでは22日となっている。多峰性となっている理由が分かれば、様々な症例を一緒にまとめ算出した平均在院日数など無意味であることが分かるだろう。

どうしたら「多峰性となる理由」に気がつけるか

ウェブ上の情報を調べたり、専門書を読んだり、専門家に聞いたりするのもひとつの方法だろう。しかし、いつでも都合よく情報が得られる訳ではない。そんなときは、ヒストグラムを様々な切り口で「料理」してみると良いだろう。

冒頭のヒストグラムについて、年間症例数の多さで3つのグループに分け、それぞれのヒストグラムを作成してみた。すると症例数の多い群では、在院日数の長い病院がほとんど見られない。


この3つのグラフから、症例数が多い病院とそうでない病院ではそもそもの診療内容に違いがあるのでは?と考えることができる。さらに、さきほど紹介した『(6)診断群分類毎の集計』の在院日数の情報などを見れば、なぜ多峰性になったか理解できるだろう。

多峰性は、すなわち「複数の単峰性のグラフの重ねあわせ」である可能性を真っ先に考えるべきかもしれない。そのようなときには上のような分割する切り口を探すことは有益な手段と言えよう。

なかなか毎回うまく行くというわけではないが、参考にしていただければ幸いだ。