점점 책을 읽은 시간이 줄어가고 있습니다.
개인적으로 머리가 텅텅 비어가는 느낌이 들곤 하는데, 점심시간을 이용하여 읽은 책이 바로 빅데이터 비즈니스입니다.
빅데이터(BigData)에 대한 여러가지 책과 이야기가 많지만 이 책을 정독한 몇가지 이유는 이 책이 주는 인사이트가 남달랐기 때문입니다.
이제까지 빅데이터 관련된 기술에 대한 이해를 하기 위하여 노력하였다면, 이 책을 읽으면서 빅데이터가 가져다 줄 수 있는 효과 등에 대하여 고민하는 시간을 가졌습니다.
아래는 책을 읽으면서 이러한 고민을 도와준 내용들입니다.
빅데이터란 무었인가?
데이터를 이용하여 "사업자에게 도움이 될 만한 유용한 인사이트"가 도출된다면 스몰 데이터라고 하더라도 유용하다.
"사업자에게 도움이 될 만한 유용한 인사이트"란 "개별적이고 즉각적이며 다면적인 검토를 거친 부가가치를 제공하고 싶어하는 요구를 만족시키는 인사이트" 라고 할 수 있다.
이렇게 본다면 아직도 불분명한 것이 바로 빅데이터란 개념입니다.
더욱 자세하게 확인하기 위하여 빅데이터의 특징을 알아볼 필요가 있습니다.
개별적이고 즉각적이며 다면적인 검토를 거친 부가가치를 제공하는 것을 기점으로 생각했을 때 빅데이터가 지녀야할 특징은 크게 세가지로 정리할 수 있다.
수 많은 개별 요소 각각에 관한 것(고해상)을 고민도로 생성(고빈도 생성)한 다양한(다양성) 데이터이다.
각각의 특징에 대하여 알아보겠습니다.
첫 번째 특징은 "고해상"이다.
즉, 기존에는 한데 묶어서 다루어왔던 현상을 각각의 요소로 분해하여 파악하고 대응할 수 있는 데이터여야 한다.
관심에 대응하기 위해서는 당연히 데이터의 해상도가 높아야 한다.
두 번째 특징은 "고빈도 생성"이다.
취득이나 생성 혹은 처리 대상이 되는 데이터의 사이즈가 크지는 않더라도 매우 높은 빈도로 생성된다면 이것은 기존에는 불가능했던 실시간 정책의 실시를 가능하게 한다.
세 번째 특징은 "다양성"이다.
정형적인 수치 데이터, 텍스트 데이터에 그치지 않고 웹 서비스를 이용한 유저의 기록, 방법 카메라 영상, 디지털 사이니지를 보는 사람의 얼굴 사진, 위치 정보, 각종 센서의 데이터에서 수집된 데이터 등 다양한 종류의 데이터를 연계하여 활용하는 것도 요구된다.
이러한 특징을 갖춘 데이터가 바로 빅데이터이다.
데이터의 사이즈가 중요한 것은 아니나 위의 3가지 특징, 고해상, 고빈도 생성, 다양성이란 특징을 갖춘 데이터가 되려면 결과적으로 사이즈가 클 수 밖에 없다. 하지만 데이터 사이즈가 작더라도 위의 3가지 특징을 갖추고 있다면 빅데이터라 볼 수 있다.
이제 빅데이터가 사업자 관점에서 필요한 이유에 대하여 알아보자.
경쟁 환경 속의 상황을 "제1의 벽"과 "제2의 벽"이라는 관점에서 정리해보자.
"제1의 벽"이란 전자화/자동화가 되어 있는지 아닌지를 구분하는 벽이다.
아직까지 비효율적인 절차, 즉 서류와 도장이 사내를 돌아다니는 회사가 있는데 이는 "제1의 벽"(전자화/자동화의 벽)을 넘지 못한 사례이다.
제1의 벽을 넘었다고 하더라도 문제가 해결된 것은 아니다.
전자화/자동화가 진행된 결과물로 눈앞에는 막대한 데이터가 생성되어 축적되고 있다. 하지만 그냥 쌓여 있을 뿐이다.
사장되었을 수도 있고, 심한 경우에는 축적되지도 않은 채 방류되는 것들도 있다.
전자화/자동화로 인해 업무의 효율적인 면에서는 큰 성장을 이루어내어 새로운 부가가치를 창출하고 있는가 하면 그렇지 않은 사업자가 아직은 많다.
즉, IT를 활용한 "제2의 벽"(인사이트 도출의 벽)에 직면해 있는 상황이다.
이 시점에서 제2의 벽을 해결하기 위하여 클라우드 기술을 활용하는 것이 일반적이다.
클라우드 서비스가 확산될수록 소프트웨어 산업 전반의 시장은 축소될 위험이 있다.
패키지 소프트웨어나 SI 개발은 이제 SaaS 서비스 등으로 이전되고 해외 사업자가 제공하는 서비스를 직접 이용하여 국내 시장의 축소가 이어지고 있다.
이러한 현상은 이미 발생하고 있다.
빅데이터 비즈니스에서 클라우드의 역활을 생각할때는 부가가치가 클라우드로 올라가는 현상에 주목해야 한다.
즉, 다양한 데이터가 단말기를 통해 네트워크를 거쳐 클라우드로 집약되는 현상이다.
사실 위의 현상을 자동화시켜주고 워크플로우화 시켜주는 것이 우리 회사가 만들고 있는 Docswave란 서비스이다.
이렇게 데이터가 클라우드로 집중되면 빅데이터의 특징을 만족하면서 제2의 벽을 넘어가기 위한 서비스를 구성 할 수 있다.
데이터 활용에 따른 효용은 여러 갈래로 나누어 지므로 우선 관심의 범위를 정한다.
다벤포트 교수는 "더 깊게 분석할수록 더 높은 경쟁 위의성을 얻을 수 있다."고 주장하며 다음과 같이 그 단계를 정리했다.
(1) 정례, 임시 보고
(2) 조사(원인 지정)
(3) 경고(대책 제시)
(4) 통계 분석
(5) 예측, 추계
(6) 예측 모델
(7) 최적화
Docswave가 앞으로 위의 1 ~ 7의 과정을 자동화할 것이다.
서비스 모델과 비즈니스 모델 관점에서 빅데이터를 활용할때 주의해야할 사항은 다음과 같다.
빅데이터를 취즉하고 활용할 때 유저에게 부담을 주어서는 안된다.
설사 유저에게 유익한 피드백을 하는 것이 최종 목표라고 하더라도, 그 근거가 되는 데이터를 취득하면서 유저에게 과도한 부담을 주면 유저는 피드백을 기다리지 않고 떠나버리게 된다.
유저에게 부담을 주지 않고 마음 편하게 기꺼이 데이터를 제공하게 만들고 그 데이터를 수집하여 처리하고 분석한 후 적절한 피드백을 실시하여 기기나 서비스의 매력을 한층 높일 수 있는 선순환을 창출해야 한다.
이를 위하여 선순환을 창출 할 수 있는 개념은 다음과 같다.
(1) 통신의 은폐
(2) 제로 클릭 서비스
(3) 속도에 의한 중독
(4) 유휴 시간과 유휴 자산 활용
제로클릭 서비스와 통신의 은폐, 그리고 빠른 속도, 시간적으로 부담을 느끼지 않게 해준다면 사용자는 데이터를 제공하는데 부담이 없을 것이다.
마지막으로 "제3의 벽"에 대하여 이해할 필요가 있다.
"제1의 벽", "제2의 벽"이 해결되었다고 "제3의 벽"까지 해결된 것은 아니며 빅데이터를 궁극적으로 활용하는 서비스는 사용자가 "제3의 벽"을 넘어갈 수 있도록 해야 한다.
"제3의 벽"은 사내 데이터 뿐만 아니라 외부의 데이터까지 활용하여 휠씬 고차원적인 인사이트를 도출해내는 과정이라고 할 수 있다.
"제3의 벽"을 넘으면 활용 가능한 빅 데이터의 양과 종류는 비약적으로 증가한다.
우리 회사의 Docswave가 모든 사용자들에게 "제3의 벽" 넘을 수 있도록 지원하는 마법사의 지팡이가 되길 기원하며, 이 책을 모두 읽었다.
이 책은 빅데이터 기술에 관한 책은 아니지만 비즈니스 모델과 서비스 모델에 대한 인사이트를 가져다준 소중한 책이다.
한번 일독 하기를 권한다.