본문 바로가기

도서관/국외소식

미 의회도서관, 트위터 아카이브 구축

미 의회도서관, 트위터 아카이브 구축  

미국 의회도서관이 트위터의 실시간 스트리밍 메시지를 사료로 분류·저장하는 작업을 본격적으로 시작했다고 씨넷이 6일(현지시간) 보도했다. 머지 않은 미래에 트위터가 학자들에게 중요한 연구 수단이 될 것으로 전망된다.

보도에 따르면 미 의회도서관은 이미 1천7백억개 가량의 트윗 아카이브를 구축한 것으로 나타났다. 도서관측은 “트위터는 새로운 의사소통과 창조적 표현의 방법으로 이제까지 도서관이 수집해온 문자, 저널, 출판물과 같이 새로운 컬렉션으로 분류될 것”이라고 밝혔다.

미 의회도서관이 트위터 아카이빙에 나선 이유는 트위터가 현재 일어나는 사건을 가장 다층적으로 솔직하게 담아내는 기록으로 평가받기 때문이다. 특히 특정 지역이나 소수의 시각이 아닌 전세계 곳곳에서 계층에 구분 없는 의견이 도출된다는 점에서 사료로서 가치가 충분하다는 판단이다.

다만 트위터는 일각에서 제기되는 사생활 침해를 우려해 메시지 보호 기능을 설정한 사용자의 메시지는 제공하지 않고 트위터 아카이브를 자격을 갖춘 연구자들에게만 공개하겠다는 방침을 세웠다.

의회도서관측은 아직까지 아카이브를 개방하지 않았음에도 전세계 연구자들로부터 ‘백신 접종율’ ‘주식 예측’ 등 다양한 주제에 관한 400건 넘는 문의를 받은 것으로 전해졌다.

전하나 기자 hana@zdnet.co.kr 2013.01.07 / AM 10:15 / ZDNet Korea
-------------------------------------

미 국회 도서관 1,700억 트윗 수집, 133TB 데이터 관리툴 찾아   
 

미국 국회 도서관이 트위터의 '트윗'을 모아 검색할 수 있도록 할 계획이다. 현재까지 수집한 트윗 수만 1,700억 건에 달한다. 이 계획은 현재 한 가지 어려움에 부닥친 상태다. 방대한 자료를 관리할 적절한 빅 데이터 관리 툴을 찾지 못한 것.

도서관은 컴퓨팅과 병렬 컴퓨팅도 생각해봤지만, 공공기간이 감당하기 부담스러운 비용 탓에 다른 방법을 모색한다는 내용이다. 이러한 어려움에도 불구하고 데이터 수집에 나선 이유는 “현재는 SNS 데이터 역시 책과 같은 가치를 가졌기 때문이다.”고 설명한다.

이를 접한 업계의 반응은 뜨겁다. 미국 국회 도서관이 말한 내용을 보면, 현재 데이터 열람 요청만 400건을 넘긴 상황이다.

앞으로 도서관은 새로운 트윗을 시간 단위로 수집할 계획이다. 2011년 2월 기준으로 하루 평균 트윗은 약 1억 4,000건 정도 된다. 지금까지 수집된 트윗의 용량은 133.2TB를 기록하고 있다.

2013-01-14 11:14:01 / 박지호 기자 / 베타뉴스