신문명도시 블로그

[여시재 북리뷰] "빅데이터 시대를 준비하는 가장 유용한 책을 만나다" - 이토 고이치로, '데이터 분석의 힘'

작성자 : 임선우 2018.11.30 조회수 : 1331





 데이터 시대라고 합니다. 작년 한 해 세계 데이터 생산량은 16제타바이트(ZB, zettabyte)이며, 데이터 시장 규모는 약 1,508억 달러에 달합니다. 앞으로도 증가 그래프는 더 가팔라질 것입니다. 과거 경제적 가치가 없거나 제대로 해석해내지 못해 활용도가 낮았던 자투리들이 모여 빅데이터(Bigdata)가 됩니다. 순식간에 인간의 삶에 유용한 ‘정보’의 지위에 오릅니다. 지금 이 순간에도 인간과 인간, 인간과 사물, 사물과 사물이 만나는 모든 지점에서 데이터는 끊임없이 생산되고 있습니다.

 하지만 저 같은 일반인들에게 데이터는 여전히 막연한 추상의 영역에 머물러 있습니다. 나아가 ‘데이터 분석’이라는 개념에까지 이르게 되면 엄두가 나지 않습니다. 수학적 지식으로 무장한 통계학자들의 영역이라고 미뤄 짐작하기 때문일 겁니다. 이미 진행되고 있는 데이터의 시대, 빅데이터의 시대에 개인은 무엇을 준비해야 할까요? 누군가에게는 기회가, 누군가에는 위기가 될 것입니다. 이대로 휩쓸려 가는 것인가? 불안감이 엄습합니다.

 시카고대 공공정책대학원 교수 이토 고이치로가 쓴 ‘데이터 분석의 힘’은 작년 일본에서 출간되자마자 ‘아마존 재팬’ 경제 분야 1위에 올랐다고 합니다. 어렵고 복잡한 수식 없이도 데이터 분석의 세계를 보여주는 힘 때문이라는 설명이 따랐습니다. 한국어 번역서를 감수한 연세대 이학배 교수(응용통계학과)는 추천사에 ‘빅데이터 시대를 준비하는 가장 유용한 책을 만나다’라고 썼습니다. 이 책은 산토리학예상, 니케이경제도서문화상을 받았습니다. 산토리 심사평에는 “통계적 인과분석에 관한 최고의 계몽서”라는 평가가 있습니다.

 책을 다 읽고 내린 결론은 이렇습니다. ‘가장 유용한’인지는 모르겠지만 ‘꽤 유용한’ 책인 것만은 분명하다는 것입니다. 이토 고이치로는 시카고대 학생들을 대상으로 강의한 내용을 토대로 일반인들도 쉽게 읽을 수 있도록 하기 위해 이 책을 썼다고 합니다. 과연 그렇습니다. 물론 이 책 한 권 읽고 데이터와 빅데이터에 대해 알게 되었다고 할 수는 없을 겁니다. 그래도 친구들과 대화 할 때 한마디 할 수 있고, 신문을 읽다가 ‘이건 통계분석에 편향이 있는 기사군’ 이라고 판단할 수 있을 정도는 될 겁니다.

 이 책에는 생생한 사례가 많습니다. 오바마 선거자금 모금팀이 구글 전문가를 영입해 지지자 데이터 분석을 통해 어떻게 6000만 달러의 자금을 더 모을 수 있었는지 자세한 과정이 나옵니다. 구글 검색을 하면 링크 제목이 파란색으로 표시되지요? 이토에 따르면 구글은 41가지의 파란색을 만들어 이용자 실험을 했다고 합니다. 물론 데이터 분석 기법이 들어갑니다. 지금 제가 보고 있는 구글 검색 링크의 파란색이 그렇게 나왔다고 합니다. 이토는 이런 다양한 사례를 4가지 대표적 데이터 분석기법을 설명하는 재료로 씁니다. 비교적 쉽게 읽히는 이유일 것입니다. 이토가 자기 책이 쉽게 읽힐 수 있도록 채택한 전략 자체가 데이터 분석의 결과일지도 모른다는 생각이 듭니다.

 이 책의 부제는 ‘그많은 숫자들은 어떻게 전략이 되었는가’입니다. 이토는 ‘데이터 해석’이라는 행위에 방점을 두고 데이터 분석을 통해 새로운 기회 창출과 이전과는 다른 발견이 가능하다는 것을 강조합니다. 또 기업 뿐 아니라 정부와 정당 및 수많은 단체들이 숫자로 표시되는 데이터를 어떻게 활용하고 있는지, 경우에 따라서는 어떻게 일반인들을 유도하기 위해 ‘편향’을 이용하는지까지 보여주려 합니다. 최근 언론에서 자주 회자되는 ‘통계의 함정’이 발생하는 이유, 즉 데이터 분석에서 흔히 범하는 오류와 실수 등도 자세히 서술하면서 데이터 분석에 있어 편견과 주관이 배제되어야만 편향과 조작을 막을 수 있다는 주장으로 이어집니다. 이 개념이 확장되면 ‘데이터 권력’ ‘데이터 주권’의 문제로까지 갈 겁니다. 이 대목에서 지난 8월 가계동향조사 결과를 정치 진영 간 다른 해석으로 논란의 대상이 되었던 통계청장의 교체가 문득 스쳐 지나갔습니다.

 “이제 데이터를 읽는 자가 확실한 미래를 만든다!”는 이 책의 표지에 적힌 문구처럼 미래는 데이터 기반 사회로 변모할 것이며, 데이터를 소유하고 분석할 수 있는 능력의 유무에 따라 새로운 계층이 등장할지도 모릅니다. 인류사에서 권력과 자본이 한쪽으로 치우치면 이에 반발하는 집단이 등장했고, 사회적 갈등이 일어났듯이 데이터도 그러한 갈등 요소가 되거나 데이터 격차가 계층 간 격차, 경제적 격차, 나아가 국가 간 격차를 확대하는 날이 머지않았습니다. 무한 복잡계인 빅데이터의 시대에 스스로 새로운 기회를 발견하여 미래를 개척하고 데이터 독점 집단에 의한 편향된 분석을 비판하고 분석할 수 있는 역량이 필요한 시대입니다.

 이 책은 사실 읽어도 그만, 안 읽어도 그만인 책입니다. 하루하루 살아나가는 데 그렇다는 얘기입니다. 하지만 일상의 저 깊은 곳에서는 일찍이 경험한 적이 없는 큰 변화가 진행되고 있습니다. 변화는 피곤한 일입니다. 하지만 피할 수 없다면 부닥치는 수밖에 없습니다. 다만 책의 말미에 ‘더 알고 싶은 사람을 위한 안내서’ 목록도 제시되어 있는데 거기까지 가고 싶지는 않습니다.

Logo
Ico up