出典:第一種衛生管理者2022年(令和4年度)10月公表問題|労働衛生(有害業務に係るもの以外のもの)第33問
問題
労働衛生管理に用いられる統計に関する次の記述のうち、誤っているものはどれか。
(1) ある事象と健康事象との間に、統計上、一方が多いと他方も多いというような相関関係が認められたとしても、それらの間に因果関係があるとは限らない。
(2) 集団を比較する場合、調査の対象とした項目のデータの平均値が等しくても分散が異なっていれば、異なった特徴をもつ集団であると評価される。
(3) 健康管理統計において、ある時点での検査における有所見者の割合を有所見率といい、一定期間において有所見とされた人の割合を発生率という。
(4) 生体から得られたある指標が正規分布である場合、そのばらつきの程度は、平均値や最頻値によって表される。
(5) 静態データとは、ある時点の集団に関するデータであり、動態データとは、ある期間の集団に関するデータである。
第1種衛生管理者|労働衛生管理統計の基礎と平均値・分散・有所見率を解説
労働衛生管理統計では、相関関係と因果関係の違い、平均値と分散の意味、有所見率と発生率、静態データと動態データの区別が重要です。答えは(4)です。正規分布におけるばらつきの程度は、平均値や最頻値ではなく、分散や標準偏差によって表します。平均値や最頻値はデータの中心的な位置を示す代表値であり、ばらつきそのものを示す指標ではありません。
(1) ある事象と健康事象との間に、統計上、一方が多いと他方も多いというような相関関係が認められたとしても、それらの間に因果関係があるとは限らない。
適切です。相関関係とは、2つの事柄が一定の傾向をもって一緒に変化する関係をいいます。例えば、ある作業環境で疲労を訴える人が多いという統計結果があっても、それだけで作業環境が疲労の直接原因であると断定することはできません。年齢、勤務時間、睡眠時間、既往歴、生活習慣など、別の要因が影響している可能性があります。統計では、相関があることと、原因と結果の関係があることは区別して考える必要があります。
(2) 集団を比較する場合、調査の対象とした項目のデータの平均値が等しくても分散が異なっていれば、異なった特徴をもつ集団であると評価される。
適切です。平均値はデータ全体の中心を示す値ですが、データがどの程度散らばっているかまでは示しません。例えば、2つの職場で健康診断のある数値の平均が同じでも、一方は多くの人が平均付近に集まっており、もう一方は極端に高い人と低い人が多い場合があります。この違いを表すのが分散です。分散が異なれば、健康リスクの偏りや管理上の注意点も異なるため、集団の特徴は違うと評価されます。
(3) 健康管理統計において、ある時点での検査における有所見者の割合を有所見率といい、一定期間において有所見とされた人の割合を発生率という。
適切です。有所見率は、健康診断などのある時点で、検査結果に異常所見が認められた人の割合を示します。これは、その時点でどのくらいの人に所見があるかを見る指標です。発生率は、一定期間中に新たに有所見となった人の割合を示す考え方です。ある時点の状態を見るのか、一定期間中に新しく発生したものを見るのかが区別のポイントです。
(4) 生体から得られたある指標が正規分布である場合、そのばらつきの程度は、平均値や最頻値によって表される。
不適切です。正規分布において、平均値や最頻値はデータの中心の位置を示す代表値です。ばらつきの程度を表す指標ではありません。ばらつきは、分散や標準偏差によって表されます。標準偏差が小さいほどデータは平均値の近くに集まり、標準偏差が大きいほどデータは広く散らばります。労働衛生管理では、検査値の平均だけを見るのではなく、どの程度ばらついているかを確認することで、集団内のリスクの偏りを把握できます。
(5) 静態データとは、ある時点の集団に関するデータであり、動態データとは、ある期間の集団に関するデータである。
適切です。静態データは、ある一時点の状態を示すデータです。例えば、ある日の健康診断結果や、ある時点での有所見者数などが該当します。動態データは、一定期間における変化や発生状況を示すデータです。例えば、1年間の疾病発生数、休業件数、災害発生件数などが該当します。時点を見るのが静態、期間中の動きを見るのが動態と整理すると覚えやすいです。
この問題で覚えるポイント
労働衛生管理統計では、平均値はデータの中心を示し、分散や標準偏差はデータのばらつきを示します。最頻値は最も多く現れる値であり、中央値はデータを大きさ順に並べたときの中央の値です。正規分布では平均値、中央値、最頻値が一致しますが、ばらつきは分散や標準偏差で判断します。相関関係は2つの事象が関連して変動する関係ですが、因果関係を直接証明するものではありません。有所見率はある時点で有所見者がどれくらいいるかを示す割合であり、発生率は一定期間中に新たに発生した人の割合です。静態データはある時点の状態を示し、動態データは一定期間の変化や発生状況を示します。
ひっかけポイント
この問題では、平均値や最頻値というよく知られた統計用語を使って、ばらつきの指標と混同させようとしています。平均値は中心、分散や標準偏差は散らばり、という役割の違いを押さえていないと誤答しやすいです。また、相関関係があると因果関係もあるように感じてしまう点もよくある思考の罠です。健康管理統計では、ある時点の割合なのか、一定期間中の発生なのかという時間の見方も重要です。統計用語は日常感覚で読むと正しそうに見える文章が多いため、代表値、ばらつき、時点、期間という分類で冷静に判断することが大切です。
