커리어와 관련하여 21세기 가장 섹시한 문장은 아마도 "데이터 사이언티스트는 21세기 가장 섹시한 직업"이라는 말일 것이다.
한 문장이 한 사람의 커리어를 결정할 수도 있다는 생각이 들정도로 강력한 문장이며 나도 한 때 데이터 사이언티스트로의 전향을 목표로 한적이 있다. 실제 수학과 소프트웨어 엔지니어링이 결합된 매력적인 분야였다 (지금은 다시 소프트웨어 엔지니어로 남겠다는 결정을 하였고 그 이유는 다른 글에서 적어보도록 하겠다.)
학문적으로 깊게 들어가지 않더라도 알기 전과 후 세상이 다르게 보이는 분야들이 있다. 글자을 읽을 수 있거나 산수를 할줄 아는 사람은 그렇지 않은 사람과 다른 세상을 산다. 진회론, 심리학이 그랬고 통계학도 그러했다.
데이터 사이언스를 위해 통계를 학습해야했다. 데이터 사이언스 쪽 일을 하지 않는 지금은 통계학을 실용적으로 쓸 일이 거의 없지만 세상을 이해하는 도구를 하나 더 얻은 느낌이다. 예를 들어 논문들이 어떤식으로 평가되고 결정되는지를 이해하게 되는데 왜 연구결과에 따르면 술을 마시거나 소고기를 먹으면 암에 걸릴 확률이 높아지기도 낮아지기도 하는지가 이해된다.
지금도 그런지 모르겠지만 통계는 수능에 한 문제가 나오거나 나오지 않기도 하기 때문에 수학에 자신이 없다면 포기하라가 정설이었다. 통계는 다른 비중있게 배우는 분야들 못지 않게 중요한데 더 중요도를 높여야하지 않는가라는 주장도 있다 (TED 영상). 미적분은 움직임과 무한을 이해하는데 도움을 주고 AI를 포함한 여러 분야에서 필수적이지만 대부분의 사람이 세상을 살아가는데에는 통계가 더욱 유용하다. 물론 그것을 비중있게 다루는 것과 사람들이 얼마나 실용적으로 사용할 수 있냐는 다른 문제일 것이다.
(나를 포함한) 얼마나 많은 사람들이 다음과 같은 말을 하거나 들으며 결론을 내리는지를 생각해보자.
"우리 할아버지는 흡연하며 건강하게 장수 하시더라."
"유명인이 담배도 안 피우고 폐암에 걸렸는데 알고보니 냉수마찰을 즐겼다고 한다."
"우리 형도 그렇고 첫째인 너도 그런걸 보니 첫째들의 특성인가보다."
노벨 경제학상을 수상한 데니얼 카너먼의 책 "생각에 관한 생각"에는 사람은 어려서부터 문법을 모르고도 문법을 익힐 수 있는 직관적인 문법가이지만 통계학자조차도 직관적인 통계학자가 아니라고 한다. 하지만 통계학에 대한 지식은 편향과 미신을 경계하는데 도움을 준다.
벌거벗은 통계학은 기본적인 통계학을 다양한 연구 결과와 함께 소개한 책이다. 그 중에는 "암컷에게 거절당한 초파리는 술로 슬픔을 달랜다"와 같은 흥미로운 연구도 있다.
또 다른 흥미로운 연구는 “하버드가 당신의 인생을 바꾸는가”이다. 치열한 입시경쟁을 보면 한국에서는 많은 사람들이 명문대가 인생을 바꿀 것이라고 생각하고 있는듯 하다.
연구는 여러 학교에 지원해 하버드에 간 학생과 갈 수 있었지만 가지 않았던 학생들을 대상으로 하였고 그들이 사회로 나온 후 수익이 얼마나 차이가 나느냐로 수행되었다. 하버드에 갈 수 있었지만 가지 않았던 사람들은 특별한 사람들이었을 수 있고 수익으로 그 사람의 인생을 판단할 수는 없다. 하지만 수익은 연구를 위한 좋은 지표가 될 수 있다.
결과는 차이가 나지 않는다였고 예외적으로 저소득층 가족의 구성원이었던 학생은 더 입학하기 어려운 학교에 갔을 때 수익이 높았다고 한다.
기도는 기도를 받는 대상에게 실제적인 영향을 미칠까. 책에는 약 30억원의 자금을 들여 1,800명의 환자를 대상으로 수행한 기도에 관한 연구도 소개한다. 그 외에도 책에서 다룬 다양한 흥미로운 연구가 있지만 결과는 스포하지 않고 남겨두도록 하겠다.
노트: 책의 원제는 Naked Statistics이며 킨들을 통해 보았기 때문에 번역서의 질이 어떤진 보지 못했지만 국내 도서 웹사이트에서 긍정적인 리뷰를 받은 것을 보아 좋을 것으로 생각된다.