업데이트 :
이글을 쓸때만 해도 하하호호 그냥 재밋는 통계문제라고 햇는데... 지금 와서 보니 현재 상황과 너무나 맞아 떨어지는 군요. 코로나 검사의 효과에 적용해서 다시 문제를 내봅니다. 이 예시를 보시면, 왜 무증상자 무접촉자 전부 검사하지 않는지 이해이 도움이 되면 좋겟습니다.
오늘의 통계 문제) 베이지언으로 풀어보는 코로나검사의 효과
ㄱ. 90% 정확하게 진단하는 코로나 검사가 잇슴다. (Specificity sensitivity 둘돠 90%)
ㄴ. 그런데 전국민의 1%가 이 코로나에 걸렷슴다.
ㄷ. 이 경우에 무증상 무접촉자 대상 검사 한다 안한다?
ㄹ. 무증상 무접촉자 1인이 양성으로 나왔을때, 실제로 양성판정자가 코로나에 걸렸을 확률을 구하시오.
...
오늘의 통계 문제) 베이지언으로 풀어보는 암검사의 효과
ㄱ. 90% 정확하게 진단하는 희귀암 검사가 잇슴다. (수정: Specificity sensitivity 둘돠 90%)
ㄴ. 그런데 이 희귀암이 희귀해서 전국민의 1%가 이 암에 걸렷슴다.
ㄷ. 이 경우에 대국민 암 검사 한다 안한다?
ㄹ. 대국민 검사해서 내가 양성으로 나왔을때, 실제로 내가 암에 걸렸을 확률을 구하시오.
8만을 위해 아무거나 막 던져봅니다
"그런 경우엔 세금을 올린다"가 정답이 아닐까요?
검사하면 세금낭비라서 아예 검사를 안하고 세금도 안올립니다.
희귀암 검사 얼마에요?
오백원임다
P(실제암걸림|검사결과양성) = P(실제암걸림 and 검사결과양성) / P(검사결과양성) = P(검사결과양성|실제암)*P(실제암) / {P(검사결과양성|실제암)*P(실제암) + P(검사결과양성|실제암아님)*P(실제암아님)} = 0.9*0.01 / {0.9*0.01 + 0.1*0.99} = 0.009 / (0.009+0.099) = 0.0833... 약 8.3%인가요? 한 십여년만에 하니 헷갈리네요...
희귀한데 1%나 걸리는겁니까!
a. 조기발견으로 치료할 수 있으면 검사한다 -> 세금이 늘어남. 보험료도 오르겠죠 -> 대기시간이 길어지고 싸움 남
-> 외국인도 검사받을 수 있느냐는 논쟁 시작 -> 외국인의 범위를 어디까지 할건지에 관한 토의 시작
b. 발견해도 치료할 수 없으면 일단 NIH 펀딩을 늘린다? -> 세금이 늘어남
c. 선거 끝나고 논의하자고 하면서 암검사 관련 공약 남발
조기발견으로 치료할 수 잇어도 정확도가 너무떨어져서 검사하면 오히려 세금 낭비다 입니다. 검사 안한다.
90% 아닌가요? ㅎㅎ 수알못....-_-
위에 정답 잇슴다.
ㄷ대국민 검사 안 한다.
ㄹ 답은 90%. 정답일까요? 오답일가요?
암에 걸렸을 시 생존율이 궁금하네요.
학부 통계서적에서 예시로 본 기억이 있어 반갑네요 ㅎㅎ 예시의 주 목적은 통계적 수치를 보이는 그대로 해석할 경우 치명적인 실수를 야기할 수 있다.. 정도로 기억하고 있는데요, 이 예시에서 희귀암 검사의 정확도가 90%라고 주어진 것은 다음 두가지 경우로 나누어서 해석해 주어야 합니다.
1) 내가 희귀암에 걸렸을 경우 이 검사를 통해 희귀암으로 진단될 확률이 90% (그리고 정상으로 진단될 확률이 10%)
2) 내가 정상일 경우 이 검사를 통해 정상으로 진단될 확률이 90% (그리고 희귀암으로 진단될 확률이 10%)
만약 2)번 케이스를 고려하지 않을 경우, 검사 결과가 양성일 때 실제로 암이 걸렸을 확률이 90%라고 답할 수 있겠지요.
이 예시에서는 내가 희귀암 검사를 통해 양성이 나왔을 경우, 내가 진짜로 1)번 케이스에 속해서 희귀암에 걸렸고, 검사를 통해 양성이 나온것인지
아니면 2)번 케이스에 속해서 정상임에도 불구하고 검사를 통해 양성이 나온것인지 고려해 주어야합니다.
편의상 전 국민이 10,000명 이라고 가정한다면, 이 중 1%인 100명이 희귀암에 걸려있겠죠. (즉, 정상인 국민은 9,900명)
이제 1)번 케이스에서 희귀암에 걸린 총 100명의 국민 중 90명이 희귀암 양성 반응을 얻게 됩니다. (90% 정확도의 검사)
그리고 2)번 케이스에서 정상인 9,900명 중 990명이 희귀암 양성 반응을 얻게 됩니다. (90% 정확도의 검사 ㅡ> 10% 확률로 오진)
따라서 내가 대국민 희귀암 검사에서 양성 판정을 받았다는 사실에서 얻을 수 있는 결론은, "90/(90+990)=8.3%의 확률로 내가 실제로 희귀암에 걸렸다"라는 것이 되겠네요.
결국 이 문제는 "희귀암 검사에서 양성을 받음"이라는 조건 하에서 "실제로 희귀암에 걸렸음"에 해당하는 조건부 확률(Conditional Probability)을 계산하는 문제인데요, 수식을 이용한 깔끔한 풀이는 위에 캄다운 님의 답변을 참고하시면 될 것 같습니다.
진지 빨고....
배이시언은 p(A|B) = p(B|A)*p(A)/p(B).
그래서 p(B|A)를 알고 있을때 어캐 p(A|B) 될까를 아는 거지요.
이 문제랑 연관지어 보면 p(검사결과양성|실제암)=0.9 을 알고 있고 p(실제암) = 0.01, p(검사결과양성) = p(암일때 양성) + p(암 아닐때 양성) = 0.9*0.01 + 0.1*0.99. 이걸 계산하면 8.3%가 나옴다.
워낙 p(B) 계산하는게 힘들어서 그냥 p(A|B) = ~p(B|A)*p(A) = ~0.009 로 옴티마이즈 하는게 배이시안임다. 그래서 0.9% 보다는 크다라고 답해야 베이지안 임다. 8.3%는 프리크시스터 계산임효.
"정확도"가 뭔가요? 실제 질병 있는 사람을 질병있다고 진단할 확률인가요? 아니면 실제 질병 없는 사람을 질병없다고 진단할 확률인가요? 이 두 확률이 인디펜던트하므로 주어진 정보만으로는 풀수가 없습니다.
본문 수정 햇슴다. 센시티비티 스페시피시티 둘돠 90%임다.
ㅋㅋ 저도 몇분들 의견 동의요. Sensitivity하고 specificity 가 같이 주어져야 "정확도" 비스무리한 이야기를 할 수 있어요.
본문 수정 햇슴다. 센시티비티 스페시피시티 둘돠 90%임다.
마모에는 절대 다수로 이과 출신분이 많으신듯요. 까만건 글자고 하얀건 화면인데 뭔소리인지 당최 모르겠네요(이과망했으면)
통계는 사회학도 많이하고 경제학도 많이하고, 문과도 통계는 잘해야죠 ㅋ
전국민의 1%가 걸리면 5000만이라 치고 50만이나 걸리는 거라 희귀암은 아니네요. 성인의 1%라던지 35세 이상의 1%랄지 제한을 두어야 할 듯.
위암을 찾아보니 "위암 발생은 34세 이전에 는 남녀 인구 10만 명당 3.8건으로 비교적 드물게 발생한 다. 이후 연령 증가와 함께 35~64세 군에서는 인구10만 명 당 63.1건, 65세 이상에는 10만 명당 260.6건으로 급속히 증가한다." 라고 하네요. 이 경우 가장 높은 65세 이상도 0.2%니까요. 아마도 인구 10만당 1건이랄지 이렇게 하셔야...
댓글 [34]