NEWHEEL [1052325] · MS 2021 · 쪽지

2021-12-27 23:07:57
조회수 1,935

정규분포의 확률밀도함수의 개형에 대한 의문점

게시글 주소: https://ebsi.orbi.kr/00042316467

 

연속확률변수의 확률밀도함수 그래프의 형태를 보고 평균을 50점으로 설정하고, 학생들의 수학점수로 확률밀도 함수 그래프를 그려보았다. 그런데 그래프에서 정의역이 0점미만, 100점 초과인 부분을 보니 점근선에 인접하게 넓이가 존재한다는 것에 의아함을 느꼈다. 그러면 이 학생들은 점수가 음수 또는, 100점을 초과하는 것인가? 그것은 말이 안되지 않나?   위와 같은 고민을 계속 하다가, 점근선의 정의 및 특징으로 의문을 해결하는데 도움을 받았다. 그래프에서 점근선 부분을 엄청나게 확대하면, 점근선의 정의에 따라 기하학적으로 x축과 거의 붙은 느낌이고, 확률밀도함수에서 넓이=확률이므로 이 부분에서는 확률이 거의 0이라고 볼 수 있다고 생각했다. 그래서 그저 내가 의문이 든 부분들은 수학적으로 이상적인 상태를 표현하기 위한 것일 뿐, 실제로 존재하고 안하고는(ex 수학점수 103점, -12점 등) 상관이 없다는 생각을 하였다. 따라서 점근선 쪽에 있는 양 끝 부분에 대해서는 너무 신경쓰지 말라는 결론을 내렸고, 그리고 평균 근처의 집중된 상태에 관심을 가지는 것이 더 괜찮은 판단이겠다는 생각을 했다.

라고 결론을 내렸는데.... ㅜㅜㅜㅜㅜ 아니 그래서 음수의 점수랑 100초과 점수가 그래프 개형에 따르면  결국에 0은 아닌 확률로 존재하는 이유가 뭔지 아시나요?????? 살려주세요 

0 XDK (+0)

  1. 유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.

  • XÆA-12 · 954304 · 21/12/27 23:09 · MS 2020

    현우진t 예전에 이거 언급하셨던 것 같은데

  • NEWHEEL · 1052325 · 21/12/27 23:10 · MS 2021

    그것두 수업중에 보긴봤는데 고등학생 선에서 그냥 이상적이다~~ 이런식으로 말씀해주셔서요..

  • 라그랑지안 · 812222 · 21/12/27 23:12 · MS 2018

    학생들의 점수분포는 이산확률분포니까 그런거 아닐까영

  • NEWHEEL · 1052325 · 21/12/27 23:14 · MS 2021

    이산확률분포여서 음수 점수, 100 초과점수가 있다고 치부하기에는 ㅜㅜ 이건 약간 이상? 같은거고 현실에서는 결국 없는거잖아용.. 그게 궁금해서요오..

  • 라그랑지안 · 812222 · 21/12/27 23:17 · MS 2018

    1. 이산확률 분포이므로 0에서 100까지만 점수가 있다. (이건 ㄹㅇ 찐 현실)
    2. 학생들의 점수분포라는 이산확률 분포가 '근사적으로' 정규분포를 따른다고 판단해도 별 문제가 없다. 그리고 분포를 통계적으로 다루는데 도움이 된다.
    3. '근사적'이란 말에서 정규분포상 100점 이상의 점수와 0점 이하의 점수는 마치 99.5점을 무시하듯, 무시할 수 있다. (0점이나 100점으로 치부하는 등으로)

    정도로 이해하면 될 것 같네요!

  • 탈걱세 · 1051259 · 21/12/27 23:17 · MS 2021

    점수는 이산확률변수인데 왜 확률밀도함수를 그림?

  • NEWHEEL · 1052325 · 21/12/27 23:20 · MS 2021

    음... 점수가 모두 정해진 시험에서야 그렇겠지만 만약에 모든 점수가 가능한 시험이라면.. 아니면 몸무게나 키라면요? ㅜㅜ 몸무게나 키가 음수일순 없자나요..

  • 라그랑지안 · 812222 · 21/12/27 23:25 · MS 2018

    일단 측정기구의 정확도/측정 범위 때문에 몸무게 조차도 우리가 다루는 데이터 상에서는 이산확률분포일 수 밖에 없어요.
    그리고 아랫분 말대로 그 경우에도 무시하는게 맞을 것 같습니다. 정규분포를 따른다고 볼 수 있는거지, 정확하게 정규분포를 따르는게 아니니까요.

  • 탈걱세 · 1051259 · 21/12/27 23:25 · MS 2021

    아 그런 의미에서 물어본거라면 예전에 수학과 다니는 분 말로는 애초에 그런 경우는 실제분포를 계산하기 쉽게 정규분포로 근사한다 개념이고 + 음의 값을 갖는 확률 자체가 매우 작아서 개무시해도 된다! 라 하심

    애초에 그 음의 값을 갖는 확률이 유의미해서 문제가 된다면 정규분포로 근사가 가능하다는 자체부터가 거짓말이기 때문이라네요

  • 탈걱세 · 1051259 · 21/12/27 23:26 · MS 2021

    애초에 엄밀히 따지면 몸무게나 키가 정규분포를 따를 수도 없음

  • NEWHEEL · 1052325 · 21/12/27 23:28 · MS 2021

    아아... 뭔가 간지러웠던 부분을 긁어주신 느낌이네요 감사합니다 행님들 여러모로

  • Asdfef · 772095 · 21/12/27 23:20 · MS 2017

    확실하진 않은데 그냥 아는대로 씨부려볼게요. 이제 통계학과 3학년임

    학생들의 점수가 정규분포를 따른다 <- 이 가정부터 잘못된 듯. 일단 학생들 점수가 이산확률분포일 뿐 아니라 말하신대로 정의역이 0~100 사이인데 정규분포를 따른다? 애초에 말이 안되죠.

    보통 정규분포 관련해선 C.L.T라고 있음. 검색하면 나오는데 어떤 개같은 분포건 여러개 모아서 표본평균 내면 근사적으로 정규분포 따름 (표본 수만 충분하다면)
    이거라고 생각하고 말해보면 표본평균이 정규분포를 따른다고 생각해도 0이하와 100이상 값은 무시해야함. 정의역(통계에선 보통 support라 말함)이 0이상 100이하인데 그 밖의 값에 확률을 줄 이유가 없기 때문.

  • NEWHEEL · 1052325 · 21/12/27 23:21 · MS 2021

    CLT가 중심한계정리 말씀하시는거죠??? 아 근데 점수로 정규분포를 따른다 한게 조금 에러인듯 한것같기도 하네요.. 근데 점수 대신에 몸무게나 키라고 한다면.. 그건 연속확률변수 아닌가요 ㅜ

  • Asdfef · 772095 · 21/12/27 23:24 · MS 2017

    예 중심극한정리ㅇㅇ 몸무게나 키로 한다해도 분포를 가정할때 정 정규분포를 쓰고 싶다면 나올 수 없는 값들은 support에서 제외하고 가정해야겠죠. 정규분포라고 있는 그대로 갖다써야하는게 아니고 현실적으로 그럴듯한 분포를 생각해내서 가정하는거니까요. 말하신대로 상식적으로 키가 음수일리가 없는데 거기에 확률을 부여해서 가정하고 있으면 미친놈이죠. 그건 통계적 가정이 아니라 SF임

  • NEWHEEL · 1052325 · 21/12/27 23:26 · MS 2021

    아하... SF라는 말에 뿜었네요 ㅋㅎㅎ 아 그니깐 애초에 정의역으로 구간을 통제해서 설령 그 구간에 대한 확률이 존재한다 치더라도 무시한다 이말씀이신거죠?

  • Asdfef · 772095 · 21/12/27 23:31 · MS 2017

    키랑 몸무게가 어떤 분포에서 나올까?하고 생각하면서 가정하는 확률분포이니 애초에 정의역 바깥에는 확률 0으로 두고 키와 몸무게를 대표한다 생각되는 원하시는 어떤 분포를 생각해내시면 됩니다. 본인이 확률분포를 만들어서 가정한다 생각하시는게 이해하시기 편할 것 같네요. 물론 통계적으로 근거가 있는 분포여야겠지만 그건 나중 얘기고..

  • NEWHEEL · 1052325 · 21/12/27 23:34 · MS 2021

    아 ㅜㅜ 감사합니다... 이해가 가네요