【第一種衛生管理者過去問】2021年10月公表問題|問28|労働衛生統計の平均値・分散・静態データと相関関係|労働衛生(有害業務以外)を解説

出典:第一種衛生管理者2021年(令和3年度)10月公表問題|労働衛生(有害業務に係るもの以外のもの)第28問

問題

労働衛生管理に用いられる統計に関する次の記述のうち、誤っているものはどれか。

(1) 生体から得られたある指標が正規分布である場合、そのバラツキの程度は、平均値や最頻値によって表される。

(2) 集団を比較する場合、調査の対象とした項目のデータの平均値が等しくても分散が異なっていれば、異なった特徴をもつ集団であると評価される。

(3) 健康管理統計において、ある時点での検査における有所見者の割合を有所見率といい、このようなデータを静態データという。

(4) 健康診断において、対象人数、受診者数などのデータを計数データといい、身長、体重などのデータを計量データという。

(5) ある事象と健康事象との間に、統計上、一方が多いと他方も多いというような相関関係が認められても、それらの間に因果関係がないこともある。

第1種衛生管理者|労働衛生統計の平均値・分散・静態データと相関関係を解説を解説

労働衛生統計では、平均値、分散、静態データ、計数データ、計量データ、相関関係と因果関係の違いを正しく区別することが大切です。答えは(1)です。正規分布におけるバラツキの程度は、平均値や最頻値ではなく、分散や標準偏差によって表されます。平均値や最頻値はデータの中心的な位置を示す代表値であり、データがどれくらい散らばっているかを示す指標ではありません。

下に移動する

(1) 生体から得られたある指標が正規分布である場合、そのバラツキの程度は、平均値や最頻値によって表される。

不適切です。その理由は、平均値や最頻値はデータの中心を示す値であり、バラツキの程度を示す値ではないためです。平均値はデータ全体をならしたときの中心的な値で、最頻値は最も多く現れる値です。正規分布では、平均値、中央値、最頻値が一致する特徴がありますが、これは分布の中心を示しているだけです。データが平均値の周りにどの程度広がっているかは、分散や標準偏差で表します。たとえば、平均身長が同じ集団でも、ほとんどの人が平均に近い集団と、非常に高い人や低い人が多い集団では、バラツキが異なります。この違いを示すのが分散や標準偏差です。

(2) 集団を比較する場合、調査の対象とした項目のデータの平均値が等しくても分散が異なっていれば、異なった特徴をもつ集団であると評価される。

適切です。その理由は、平均値が同じでも、データの散らばり方が異なれば集団の性質は異なるためです。平均値は集団全体の中心を示す指標ですが、それだけではデータの広がりまでは分かりません。分散が小さい集団は、個々の値が平均値の近くに集まっている集団です。分散が大きい集団は、平均値から離れた値が多く、ばらつきの大きい集団です。労働衛生管理では、健康診断結果や作業環境測定値を見るときに、平均値だけでなく分散や標準偏差も確認することで、集団の特徴をより正確に把握できます。

(3) 健康管理統計において、ある時点での検査における有所見者の割合を有所見率といい、このようなデータを静態データという。

適切です。その理由は、ある一時点における状態を示す統計データは静態データと呼ばれるためです。有所見率とは、健康診断などで何らかの異常所見が認められた人の割合をいいます。たとえば、ある年度の定期健康診断で受診者100人中20人に有所見があった場合、有所見率は20%です。このように、特定の時点での状態を切り取って示すデータは静態データです。これに対して、時間の経過に伴う変化を追うデータは動態データと考えると整理しやすいです。

(4) 健康診断において、対象人数、受診者数などのデータを計数データといい、身長、体重などのデータを計量データという。

適切です。その理由は、計数データと計量データはデータの性質によって区別されるためです。計数データとは、人数、件数、回数のように数えて得られるデータです。健康診断の対象人数、受診者数、有所見者数などが該当します。計量データとは、身長、体重、血圧、血糖値のように測定して得られる連続的なデータです。試験では、数えて得るものは計数データ、測って得るものは計量データと押さえると判断しやすくなります。

(5) ある事象と健康事象との間に、統計上、一方が多いと他方も多いというような相関関係が認められても、それらの間に因果関係がないこともある。

適切です。その理由は、相関関係があることと、原因と結果の関係があることは別の意味だからです。相関関係とは、一方の値が増えると他方の値も増える、または一方が増えると他方が減るといった統計上の関係をいいます。しかし、相関が認められても、一方が他方を直接引き起こしているとは限りません。第三の要因が影響している場合や、偶然に関係があるように見える場合もあります。労働衛生では、統計結果を読むときに、相関があるから直ちに因果関係があると判断しないことが重要です。

下に移動する

この問題で覚えるポイント

労働衛生統計では、平均値、中央値、最頻値はデータの中心を示す代表値であり、バラツキを示す指標ではありません。バラツキの程度は分散や標準偏差で表します。正規分布では平均値、中央値、最頻値が一致しますが、分布の広がりは標準偏差を見る必要があります。平均値が同じ集団でも、分散が異なれば集団の特徴は異なります。静態データはある時点の状態を示すデータで、有所見率などが該当します。計数データは人数や件数のように数えるデータで、計量データは身長、体重、血圧のように測定するデータです。相関関係は二つの事象が統計上関連して動くことを意味しますが、因果関係は一方が原因となって他方を生じさせる関係です。相関関係があっても因果関係があるとは限らない点は、統計問題で特に重要です。

下に移動する

ひっかけポイント

この問題の大きな罠は、正規分布では平均値、中央値、最頻値が一致するという知識と、バラツキを示す指標の知識を混同させる点です。平均値や最頻値は代表値なので、統計に関する用語としては正しそうに見えます。しかし、問われているのは中心ではなくバラツキです。バラツキときたら分散や標準偏差を思い出す必要があります。また、平均値が同じなら集団も同じように見えるという日常感覚にも注意が必要です。統計では、平均値だけでなく分散を見ることで、集団の散らばり方や特徴を判断します。さらに、相関関係と因果関係も混同しやすい用語です。統計上関連があることと、原因と結果の関係が証明されたことは別であるため、相関があるから因果関係があると決めつける文章には注意が必要です。

次の問題へ