出典:第一種衛生管理者2023年(令和5年度)10月公表問題|労働衛生(有害業務に係るもの以外のもの)第30問
問題
労働衛生管理に用いられる統計に関する次の記述のうち、誤っているものはどれか。
(1) 生体から得られたある指標が正規分布である場合、そのばらつきの程度は、平均値や最頻値によって表される。
(2) 集団を比較する場合、調査の対象とした項目のデータの平均値が等しくても分散が異なっていれば、異なった特徴をもつ集団であると評価される。
(3) 健康管理統計において、ある時点での検査における有所見者の割合を有所見率といい、このようなデータを静態データという。
(4) 健康診断において、対象人数、受診者数などのデータを計数データといい、身長、体重などのデータを計量データという。
(5) ある事象と健康事象との間に、統計上、一方が多いと他方も多いというような相関関係が認められたとしても、それらの間に因果関係があるとは限らない。
第1種衛生管理者|労働衛生統計の基礎と有所見率・相関関係を解説
労働衛生統計では、平均値、分散、標準偏差、有所見率、計数データ、計量データ、相関関係と因果関係の違いなど、基本用語の正確な理解が問われます。答えは(1)です。ばらつきの程度を表す代表的な指標は分散や標準偏差であり、平均値や最頻値はデータの中心的な位置を表す指標です。統計の問題では、「中心を表す値」と「散らばりを表す値」を混同しないことが重要です。
(1) 生体から得られたある指標が正規分布である場合、そのばらつきの程度は、平均値や最頻値によって表される。
不適切です。平均値や最頻値は、データがどのあたりに集中しているかを示す代表値です。平均値はデータの合計を個数で割った値であり、最頻値は最も多く現れる値をいいます。これらはデータの中心的傾向を表すものであり、ばらつきの程度を表すものではありません。ばらつきの程度を表す代表的な指標は、分散や標準偏差です。たとえば、同じ平均身長の集団でも、全員が平均値に近い集団と、非常に高い人や低い人が多い集団では、ばらつきが異なります。この違いを示すのが分散や標準偏差です。正規分布では、平均値を中心として左右対称にデータが分布しますが、その広がり具合は標準偏差で判断します。
(2) 集団を比較する場合、調査の対象とした項目のデータの平均値が等しくても分散が異なっていれば、異なった特徴をもつ集団であると評価される。
適切です。平均値が同じであっても、分散が異なれば、データの散らばり方が異なります。たとえば、2つの職場で平均血圧が同じであっても、一方はほとんどの労働者が平均値付近に集中し、もう一方は低い人と高い人が大きく分かれている場合があります。この場合、平均値だけを見ると同じように見えますが、健康管理上の意味は異なります。分散が大きい集団では、個人差が大きく、リスクの高い人が含まれている可能性もあります。集団の特徴を把握するには、平均値だけでなく、分散や標準偏差も見ることが大切です。
(3) 健康管理統計において、ある時点での検査における有所見者の割合を有所見率といい、このようなデータを静態データという。
適切です。有所見率とは、健康診断などで何らかの異常所見が認められた人の割合をいいます。たとえば、健康診断を受けた労働者100人のうち20人に所見があれば、有所見率は20%です。ある時点での状態を示すデータは静態データと呼ばれます。これに対して、一定期間内の発生状況や変化を示すデータは動態データといいます。健康管理統計では、ある時点での健康状態を把握するのか、時間の経過による変化を把握するのかを区別することが重要です。
(4) 健康診断において、対象人数、受診者数などのデータを計数データといい、身長、体重などのデータを計量データという。
適切です。計数データとは、人数や件数のように数えて得られるデータです。健康診断の対象人数、受診者数、有所見者数などがこれに当たります。計量データとは、測定して得られる連続的な数値データです。身長、体重、血圧、血糖値などが代表例です。計数データは「何人」「何件」と数えるデータであり、計量データは「どのくらいの量か」を測るデータです。この違いは、統計処理やグラフ化の方法を考えるうえでも基本になります。
(5) ある事象と健康事象との間に、統計上、一方が多いと他方も多いというような相関関係が認められたとしても、それらの間に因果関係があるとは限らない。
適切です。相関関係とは、2つの事象が関連して変動する関係をいいます。たとえば、ある作業環境要因が高い職場ほど、ある健康異常が多く見られる場合、統計上の相関があるといえます。しかし、相関があるからといって、必ず一方が他方の原因であるとは限りません。別の要因が関係している可能性や、偶然に関連して見えている可能性もあります。因果関係を判断するには、時間的な前後関係、ばく露量と影響の関係、他の要因の影響などを慎重に検討する必要があります。試験では、「相関関係がある=因果関係がある」と考えないことが大切です。
この問題で覚えるポイント
労働衛生統計では、平均値、中央値、最頻値はデータの中心的傾向を示す代表値であり、分散や標準偏差はデータのばらつきの程度を示す指標です。正規分布では平均値を中心に左右対称に分布し、標準偏差が小さいほど平均値付近に集中し、標準偏差が大きいほど広く散らばります。有所見率は、健康診断などで所見のあった者の割合を示す指標であり、ある時点の状態を示す静態データに当たります。計数データは人数や件数のように数えるデータで、対象人数、受診者数、有所見者数などが該当します。計量データは測定して得られるデータで、身長、体重、血圧、血糖値などが該当します。相関関係は2つの事象が関連して変動する関係ですが、因果関係を意味するとは限りません。統計の正誤判断では、代表値とばらつき、静態データと動態データ、計数データと計量データ、相関関係と因果関係を区別できることが重要です。
ひっかけポイント
この問題の最大のひっかけは、平均値や最頻値という聞き慣れた統計用語を見て、何となく正しそうだと判断してしまう点です。平均値や最頻値はデータの中心を表す値であり、ばらつきの程度を表す値ではありません。ばらつきと聞いたら、分散や標準偏差を思い浮かべる必要があります。また、平均値が同じなら集団の特徴も同じだと考えてしまうのも典型的な誤りです。平均値が同じでも、分散が異なれば集団の中身は大きく違います。さらに、相関関係と因果関係の混同も頻出です。統計上の関連が見られても、原因と結果の関係が証明されたわけではありません。統計用語は日常語の感覚で読むと誤答しやすいため、「中心」「ばらつき」「割合」「数えるデータ」「測るデータ」「関連と原因の違い」を意識して判断すると、同じテーマの問題に対応しやすくなります。
