2015/12/05

【初心者向け企画】分析の初歩を学ぼう 第2回 実践的なヒストグラム作成

前回、【初心者向け企画】分析の初歩を学ぼう 第1回 ヒストグラムで、「目的意識を持とう」というお題をいただいたので、前回のデータを元に考察をすすめてみました。

2015/12/6 赤字でコメントを書きました(Masaru Watanabe)

課題① 名前が一番長い病院と一番短い病院で自分がその当事者だったら意識にどのような差が生じるか考えてみる

一番文字数が短い病院は「橘病院」で24.8%、一番文字数が長い病院は「長野県厚生農業協同組合連合会富士見高原医療福祉センター 富士見高原病院」で29.7%。あまりにもランダムに抽出しすぎて差がない結果となったので、病床数が一番少ない病院と多い病院で考えてみました。

一番病床数が少ない病院は「医療法人 豊資会 加野病院」で38.1%、一番病床数の多い病院は「藤田保健衛生大学病院」で83.1%でした。

他院より紹介ありの率の施設分布(黄色:加野病院の位置 薄緑:藤田保健衛生大学の位置)

加野病院の担当者になって考えてみる・・・
単純に他院より紹介ありの率の平均値を求めると42.6%なので、自院の38.1%はやや低いように思います。場合によっては何か問題があるように感じますが、ヒストグラムでみると、左の山のちょうど中腹位にあり最も平均的なポジションとも言えます。他の多くの病院も似たような値であるため、この「他院より紹介ありの率」が経営等の大きな障害になっていると考える必要はなさそうですが、紹介患者を受け入れる努力の余地はまだまだあると言えそうです。

→平均値とヒストグラムを一緒に考えてみた点は非常に良いと思います。右側になだからな分布であるため、平均値はピークの位置よりも右側にずれています。ヒストグラムを作って確認することがベターと思いますが、何十、何百の項目を分析している場合などは、労力的にも難しいと思います。そのようなヒストグラムを作らない場合にも、平均値に加え、最頻値や中央値を一緒に確認することが大事と思います。

藤田保健衛生大学の担当者になって考えてみる・・・
83.1%は平均値からみても、ヒストグラムをみても上位に位置しています。紹介ありの率が高ければ、地域の中枢病院と言えるように思いますので、大学病院としての機能を象徴している数値と言えそうです。今後も現状を維持していけばいいのかもしれません。また、救急外来以外はほとんど紹介ということなのかもしれません。

→大学病院だけピックアップして、ヒストグラムを作ってみると興味深い結果が得られるかもしれません。課題②のテーマにも通じることですが、なるべく条件の揃った比較対象群を用意することで、より有益な示唆を分析から得ることができると思います。

課題② 病床数が多い群と少ない群にわけヒストグラムを作ってみる。差が生じるか。

上: 病床数の少ない群 下:病床数の多い群
上が病床数で並べて病床数が少ない902施設を対象とした図(以降、少群)、下が病床数で並べて病床数が多い902施設を対象とした図(多群)になっています。

違いがはっきりと出ました。少群は2群に分ける前の全体のグラフと比べ、左よりの急な山を描いていて、右側はほとんどゼロに近い横ばいになっています。一方、多群は真ん中にピークがくるなだらかな山になっています。「少群より、多群の方が全体的に紹介率が高い」ということが感覚的に理解できます。

→ヒストグラムの形に明確な差異が生じましたね。自分も答えを知らずに課題を出しているので、きれいな結果が出て、ほっとしました。

自院が病床数が多いにも関わらず、紹介率が低く山の左側に位置していたとしたら、何かしら手を打つ必要があるということかもしれません。

また、課題①で検討した加野病院は、病床数少群の中ではそこそこ良い数値だったと言えそうです。

→そのような解釈もできそうです。分析の仕方次第で、数値の印象が変わるということです。つまり、そこが「分析のスキル」であり、「説得力の源泉」でもあります。病院の経営改善や組織改革を主眼に置く場合、高度な分析手法は必ずしも必要ではなく、高校レベルまでの知識で大抵のことはできてしまいます。

まとめ

平均値と比較して良い悪いを考えるだけでなく、分布を見ることにより情報が増えることを理解できました。仮に平均値より低い場合でも、頻度が高いところに位置しているか否かによって、印象が変わると言えそうです。

また、ヒストグラムを並べることで、病床数のような属性の違いにより、分布結果が異なることをひと目で把握できることが分かりました。1,800以上の施設では、規模も機能も大きく異なっているはずで、そのような事情を考慮して分析することで、より有益な情報が得られるように思いました。今回は2群に分ける切り口として病床数の多い少ないの1種類だけでしたが、他の切り口を考え、実際にヒストグラムを作ってみる・・・という作業も楽しいのかもしれません。

次回は、ヒストグラムの残り、多峰性のグラフを分析してみたいと思います。

→ヒストグラムの作成とそこから見えてくる情報の可能性について、ある程度理解してもらったようで何よりです。今後、多くのデータの分析をしてもらおうと思います。余談ですが、ヒストグラムを作るときには、データ個数(N数)や平均値、標準偏差などを一緒に記載すると信頼性向上の観点から良いと思われます。