티스토리 뷰


 연휴를 보내고 하니 막연한 느낌이 든다. 약간 복습해보자면...

 자유도란 개념에 대해 자세하게 알아보았다. 표본분산과 모분산의 차이가 나는데 이를 줄여주기 위해 자유도를 사용한다. 더 정확히는 불편추정량이 맞지만.. 자유도라는 개념이 아직 잘 안들어온다. 공부하다보면 나중에 또 부딪힐 일이 생길테니, 일단 또 여기서 건너가는걸로..(반복하는 것 같다.)

 RMS : 음의 숫자로 인해 평균이 0이 나올때, 대략적인 평균을 구할 수 있는 방법이다.

 '오차', '편의', '이탈값'이란 용어가 나왔다. 반복 측정하며 결과값을 얻다보면, 고민해야 하는 값들을 표현한 단어다.

 이탈값은 이론에 맞지 않을 경우, 잘못 관측된 것이라 생각하고 무시하는 값이다. 그러나 이는 매우 조심해야 한다. 관측 결과를 그대로 받아들이지 않고 자기 마음대로 이론을 만들어버릴 수 있기 때문이다. 이것이 이탈 값인지, 자신이 세운 가설을 수정해야할 증거인지 고민이 필요하다는 말이다.


 복습문제가 재미있는데(추리 문제 같다) 풀어봐야겠다.

 연습문제 2. ... 불경기에는 시간당 평균임금이 상승하고 불경기가 끝나면 시간당 평균임금이 하락하기 시작한다. 이를 어떻게 설명하겠는가?

- 호황기에는 채용을 많이 한다. 사업규모를 키우게되면 당연히 사람들을 많이 필요로 하게 되고, 사람 수가 많이 늘어난다. 직원수를 급속도로 늘릴 땐, 대개 평균적으로 낮은 임금의 사람들로 채운다. 그러나 불경기가 되면 핵심 맴버만 두고 나머지는 정리해고를 한다. 그렇기 때문에 그 해에 연봉 상승률이 0%가 되더라도 저임금의 직원들이 정리해고 되었기에 평균 임금이 상승했을 가능성이 있다.

연습문제 8

- 통제집단과 처리집단이 무작위로 배정되지 않는다면, 어떤 결과가 나올까?

- 주로 편향된 결과가 나올 것이다. 한쪽 성향의 사람들만 실험에 응했을 수 도 있으니까 말이다.

- 그러나 문제를 풀기 앞서 질문을 해야할 것 같다. 무슨 실험일까?

- 1. 어떤 실험이든 관계없이, 피실험자들의 체중을 조사해보았다면? 1번 실험이 무작위로 배정이 안되었을 가능성이 크다. 2번에 비해 표준편차가 적고, 평균 몸무게가 처리집단과 통제집단 간의 차이가 크기 때문이다. 편향되어 있다.

- 2. 다이어트나 건강 식품으로서 결과값으로 나왔다면? 이전과 이후의 값에 대한 차이가 없는 걸 봐서는 2번은 아닐 것이다. 1번이 질문의 의도일 것 같지만, 2번으로도 생각하고 풀어볼 수 있나? 몇가지 가정을 해보자.

 - 건강식품이 효능이 있다면? 처리집단과 통제집단 간의 차이가 뚜렷하게 날 것이다.

 - 건강식품이 효능이 없다면? 처리집단과 통제진답 간의 차이가 뚜렷하지 않을 것이다.

- 건강식품이 효능이 있는지에 대한 신뢰성(?)을 알 수 있다면, 좀 더 나은 추리를 할 수 있을 것 같다.



오늘은 여기까지!