[IT 이야기] 빅데이터의 V
[IT 이야기] 빅데이터의 V
이 기사를 공유합니다

김홍철 한국기술금융협회 IT 전문위원

 

파괴적 혁신(disruptive innovation)을 근간으로 한 4차 산업혁명을 대표하는 여러 가지 기술들은 인공지능(AI), 사물인터넷(IoT), 나노기술, 3D프린팅 등 다양한 키워드들로 소개되고 있는데, 이들 산업의 핵심 뼈대를 마련하고 제공하는 데 가장 중요한 수단은 단연 ‘빅데이터(Big Data)’라고 볼 수 있다. 즉 4차 산업혁명의 각 분야를 연결하는 주요 고리가 바로 빅데이터라는 것이다.

우리가 사용하는 인터넷 공간이 제공하는 디지털라이프에서는 지금 이 순간에도 수많은 데이터가 만들어지고 검색되고 저장, 전달되고 있다. 특정 사이트에 회원가입을 위해서 정보를 제출하기도 하고, 혹은 지도를 검색하거나 경치를 촬영해 아카이브에 전송하고, 텍스트로 트위터와 SNS를 하는 행위 모두 데이터가 생성, 연결되는 과정에 다름 아니다. ‘뉴스피드(new speed)’라고 불리는 디지털 공간상에서 형성된 데이터 트래픽들은 그 폭발적 증가뿐만 아니라 일정한 형태가 없다는 점에서 ‘빅데이터’는 단지 ‘크다’ 혹은 ‘넓다’라는 개념을 넘어 ‘무한하다(limitless)’라는 개념으로 해석하는 게 오히려 더욱 정확할 것이다. 이러한 ‘빅데이터’의 특징을 논할 때 주로 사용하는 것이 3V이다. 

3V란 빅데이터가 가지는 ‘크기’를 뜻하는 ‘Volume’, 다양성을 뜻하는 ‘Variety’와 속도를 뜻하는 ‘Velocity’를 의미한다. ‘사이즈’ 즉 크기라 함은 데이터의 물리적인 크기, 즉 개인이 생성한 데이터, 기업 경영관련 기록, 웹데이터 등을 말하며 현재 그 규모는 페타 바이트, 즉 기가바이트의 100만배 크기까지 확장돼 있다. 2시간짜리 동영상이 약 2기가 정도 소요되므로 영화 50만편 이상의 데이터 규모라고 상상하면 되며, 이들 크기에 더하여 SNS, 유튜브 등에서도 동영상 업로딩, 트윗 등 어마어마한 데이터가 실행되고 있다. 유튜브 외에도 동영상 데이터를 취급하는 네이버TV, 다음의 카카오TV, 아프리카TV 등에서도 수많은 영상들이 소통되고 있는 실정이니 데이터의 크기 확대는 거의 무한정이라는 말을 실감할 수밖에 없다. 이같이 다양한 방면에서 엄청나게 생성된 데이터들이 빅데이터화 되는 것인데 무수히 생성되는 이 데이터들을 효과적으로 신속히 이용하기 위해서는 속도의 의미가 중요시 될 수밖에 없다. 즉 생성돼 축적된 데이터를 적절히 또한 빠르게 이용하기 위해서는 저장된 데이터를 처리하고 분석해내야 하며, 이를 위해서는 클라우드나 대규모 집적 저장소가 필요하며 이를 통해 수집, 유통되는 시스템을 구축해야 한다. 

이상의 3가지 V가 기존 ‘빅데이터’의 주요 요소 혹은 기본적 성격으로 대표돼 왔는데 최근에는 몇 가지 V가 더 추가됐으며 그 내용은 다음과 같다. 첫째는 정직, 정확성을 의미하는 ‘Veracity’이다. 이는 데이터가 쌓이고 축적, 유통되는 과정에서 정확도를 파악하기 어려우므로, 정부 정책이나 기업전략 수립 등에 활용하기 위해서는 정확한 데이터를 추출하기 위한 정확성이 빅데이터의 성공 요소로 중요하게 고려돼야 할 요소라는 것이다. 다음으로 제시되는 V는 가변성을 뜻하는 ‘Variability’이다. 개인의 생각이나 의견을 피력하는 SNS 공간은 상호 공감을 불러일으킬 수 있으나 경우에 따라서는 공격의 대상이 되기도 하는 양면성을 가지고 있다. 즉 특정 사안에 대한 개인들의 생각이 완전히 일치할 수는 없는 것이며 찬반이 나뉘거나 긍정과 부정으로 갈리는 것은 지극히 자연스러운 것이다. 다시 말하면 빅데이터에 쌓이는 수많은 정보들은 단순히 “1 더하기 1은 2이다”라는 획일적 성격이 아니라, 글 맥락에 따라 부여되는 의미가 달라질 수 있으며, 데이터의 본질이 변화될 수 있다는 측면에서 온라인상에서 거론된 키워드들은 매우 가변적이며, 이러한 가변성을 감안한 전반적 흐름을 인식하고 파악하는 것이 중요하다. 마지막 키워드는 시각화를 의미하는 ‘Visualization’이다. 정보는 셀 수 없이 많은데 어떤 것을 추출해야 할지 모르는 케이스를 위해 직접 눈으로 확인할 수 있는 정보 제공이라는 차원에서 시각화라는 것이 등장한 것이며 이를 통해 정보전달의 유효성을 키우고 디지털 공간을 확장하는 측면이 중시돼야 한다는 것이다. V는 시대의 변화에 따라 진화되고 있다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.