이 책은 인문학에서도 빅데이터를 인문학에 이용할 수 있다는 사실을 알려주었다. 구글에선 전 세꼐의 책을 디지털화 하겠다는 계획을 냈다. 그리고 실제로 1억이 넘는 수의 책을 디지털화 했다. 또한 엔그램을 만들었다> 엔그램 뷰어를 통해 단어를 입력하면 500만권으로 이루어진 거대한 데이터 세트에서 그 단어 사용빈도가 높은 그래프로 그려저서 나온다. 저자들은 인류 역사 문화를 들여다보는 새로운 렌즈로 활용하는 샘이다
이 책은 역사적 변화를 수량화하고자 우리가 7년을 기울인 노력이다. 걸처로믹스라고 부르는 언어와 문화 역사에 대한 접근법이다. 영문법의 변화에 관해서도 밝혀내고, 사전들이 어떤 힐수를 했고, 사람들은 어떻게 유명해지며, 정부가 어떻게 사상을 억압하고, 사회가 어떨게 배우고 망각하는지 알려준다.
영어의 불규칙 동사는 수 세기 전 패턴을 오늘날 까지 유지하고 있는 유일한 단어이다. 오히려 규칙동사보다 불규칙 동사가 그대로 유지된다
유명해진 사람들을 분석해본 결과 데뷔 기하급수적 성장 점진적 쇠각,의 공통 패턴을 가지는 것을 확인 > 현대로 들어오면서 명성의 나이가 어려지고, 살인과 명성은 연결되어 있는 점을 확인함,
나치정권을 조사해보면 일정기간 동안 특정단어와 구절이 갑자기 사라지는 특징을 보인다.
-
빅데이터 인문학: 진격의 서막 출판 사계절