본문 바로가기

책을 읽고

<빅데이터를 지배하는 통계의 힘>을 읽고

책링크: https://www.yes24.com/Product/Goods/118755890

 

빅데이터를 지배하는 통계의 힘 - 예스24

빅데이터 시대 우리에게 필요한 것은 통계적 사고다!영화 〈마이너리티 리포트〉에는 사람들이 쇼핑센터를 지날 때 고객의 동공을 스캔해서 인식한 광고판이 각각의 사람에게 지금 당장 필요

www.yes24.com

 

한문단 요약

통계학은 현대 시대에 진실을 가장 가깝게 증명할 수 있는 학문이다.

임의화로 추출한 각 집군들에 원하는 액션들을 취한다음 그 결과를 서로 비교하면, 해당 액션의 효과를 정확하게 알 수 있다.

이는 실제로 현대시대의 대부분의 자연과학, 사회과학 분야에서 가설을 입증하기 위해 사용되는 방법이다.

임의화로 추출하기 어려운 상황일 경우에는 층별해석, 성향점수 분석, 회귀분석 등의 방법들을 활용하여 해결할 수 있다.

이처럼 가장 강력한 에비던스로 꼽힐 수 있는 통계학을 공부하고 기본 소양을 갖추면, 우리는 더욱더 진실에 가까운 삶을 살아갈 수 있다.

 

 

느낀 점

기본적인 통계기법, 그리고 통계를 활용하는 각 분야들에서 통계학을 어떻게 조금씩 다른 입장에서 접근하는지를 알 수 있었던 유익한 책이었다.

특히 아래의 사실들을 새로 알게 되어 좋았다.

- 층별해석으로 심슨패러독스를 해결할 수 있다는 점. (두 개념이 직접적으로 연관된 개념인 줄 몰랐음)

- 성향점수의 경우, 로지스틱 회귀분석을 통해 점수화하여 메길 수 있다는 것

- 회귀분석으로 얻어진 계수를 활용하여, 특정한 변수값을 다른 값으로 가정 & 가정할 떄 달라지는 영향도(=회귀계수)를 반영할 수 있다는 것 (= 층별해석의 효과)

- 교호작용이 있을 시에 이를 변수화하여 회귀분석 데이터로 활용할 수 있다는 것 (= 피쳐엔지니어링 아이디어)

 

그리고 여러 분야에서의 통계학에 대한 스탠스를 이해할 수도 있었다.

특히 베이즈통계이론에 대해서 조금 알게 되었는데, 생각보다 단순한 원리라서 의외기도 했다.

읽어볼만한 책이다.