본 책은 데이터를 통해 바라보는 통계라는 관점에서 수량데이터와 범주형 데이터를 통해 실제 통계에 사용되는 중회귀분석, 로시스틱스분석 그리고 주성분분석까지 어떻게 다가갈 수 있는지를 설명하는 서적이고 여기서 수량 데이터를 이해함에 있어 평균, 제곱합, 분산, 표준편차와 데이터의 기준화까지 그리고 범주형 데이터를 통해 비율과 2진데이터를 이해하는 방법 그리고 데이터의 시각화와 모집단의 비율까지를 다루고 있어 통계의 기본을 이해하는 것은 큰 무리가 없을 것 같다. 더욱이 빅 데이터의 환상을 강조하지 않고 결국 인과관계를 모색하기 위한 것이 통계학의 본질이라는 관점에서 바라본 저자의 시각에 크게 공감할 수 있었다. 본 책은 문과출신의 저자와 유명 통계학자인 선생님으로 지칭되는 다카하시 신의 대화로 이루어져서 마치 대화를 하듯 편하게 읽어나갈수 있다. 본 책의 서두에서 말하듯이 책 한권으로 통계학을 배울 수는 없다. 통계학도 하나의 학문분야인데 대화체 내용의 책 한권으로 통계학을 정복하겠다는 것은 말도 안되는 욕심일 것이다. 그렇기에 책은 먼저 불가능하다는 것을 인지시키고 단지 살아가는데 필요한 정도의 통계학 기술을 배우는 것을 목적으로 한다는 점을 분명히 한다. 책의 구성은 총 7일간의 대화를 통한 강의와 보강의 형태로 구성되어 있다. 먼저 1일째는 통계학이란 어떻 학문인지에 대한 가벼운 맛보기식의 이야기와 중회귀분석, 로지스틱회귀분석, 주성분분석의 대표적인 3가지 분석기법을 알려주고 최근 많이 들리는 빅데이터라는 말이 주는 함정에 빠지지 않도록 주의점을 알려 준다. 그리고 2일째에는 무작위 추출법이라는 조사방법을 알려주는데 단순 무작위 추출법, 층별 추출법, 2단 추출법, 층별 2단 추출법이 그것이다. 조사사례를 통해서 이 추출법에 대해 설명한다. 3일째 강의에서는 수량 데이터에 대한 이야기를 한다. 익히 들어온 평균에 대한 설명부터 제곱합, 분산, 표준편차에 대한 용어 설명을 하는데 데이터가 흩어진 정도라거나 기준점과 같이 쉬운 단어들을 사용한다. 4일째 강의에서는 범주형 데이터에 대한 이야기로 분위기 파악 방법이나 변형, 집계 방법을 보고 그것이 타당한지 틀렸는지를 스스로 파악할 수 있게끔 기초지식을 배울 수 있다. 5일째 강의에서는 데이터를 한눈에 알 수 있게 하는 히스토그램과 그래프를 설명하고 밀도 함수, 표준 정규분포와 같은 통계 용어들이 나온다. 6일째 강의에서는 표본 데이터에서 모집단의 상화이나 공식을 도출하는 방법, 모집단의 비율을 추정할 수 있는 방법을 이야기 하고 7일째에서는 중회귀 분석을 해보는 실전연습으로 회귀 분석이 무엇인지를 알려주고 정해진 공식에 대입하는 방법과 더불어 해석하는 방법을 이야기 해주며 실측값, 예측값, 잔차, 결정 계수라는 용어들이 제시된다. 그리고 마지막 보강 부분에서 통계적 가설검정이라는 제목으로 이전의 강의들에서 배운 내용을 토대로 통계자료를 보고 가설이 옳은지 추론할 수 있는 검정기법을 알려준다. 이 책은 각종 통계분석자료를 그저 무비판적으로 받아들였던 사람에게 통계자료를 비판적 시각으로 보고 조사결과에 대한 타당성을 생각해 보는데 도움이 될 것으로 보인다.