주목할만한 실리콘밸리의 ‘빅 데이터’ 스타트업 7개

얼마 전에 스탠포드 SEED라는 모임의 초대로 스탠포드 석사, 박사과정중에 있는 학생들, 교환학생들, 그리고 실리콘밸리에 사는 한인들을 대상으로 강연을 할 기회가 있었다. 이 행사를 주최하는 분들과 이야기를 나누면서, 그냥 책 이야기나 내 이야기를 할 것이 아니라, ‘실리콘밸리’를 주제로 강연을 만들어보기로 했다. 특히 ‘주목할만한 스타트업들’을 이야기해주면 좋을 것 같다고 해서, 그동안 관심 있었던 회사 뿐 아니라 새로운 회사들을 좀 발굴하고 싶어서 조사를 해 봤다. 실리콘밸리에 워낙 실력 있는 스타트업이 많아 몇 가지만 골라내는 것 자체가 쉽지 않았는데, 그 중 가장 흥미를 자극한 것은 ‘데이터’를 기반으로 한 스타트업들이었다. 내가 이 분야에 관심이 많아서 그런 회사들이 유독 눈에 띄는 면도 있다. 스타트업 정보를 가장 잘 모아 놓은 웹사이트 중 하나인 엔젤리스트(Angelist)에서 ‘Big Data Analytics Startups’로 검색하면 무려 558개가 나온다. 그 중 몇몇 회사들로부터는 링크드인(LinkedIn)을 통해 연락이 와서 인터뷰를 하면서 더 자세히 알게 되기도 했기에, 내가 직접 써봤거나 내부 사정을 잘 아는 회사들 위주로 소개를 해보겠다.

글의 제목에 ‘빅 데이터(Big Data)’라는 단어를 넣은 것은 눈길을 끌기 위함이고, 사실 많은 경우 ‘빅데이터’는 마케팅 유행어(Buzz Word)로 쓰이는 경우가 많기 때문에 내가 그렇게 좋아하는 단어는 아니다. 데이터를 분석하고 데이터를 통해 인사이트를 얻는 것은 옛날에도 했던 일이고 그 자체가 새로운 일은 아니기 때문이다. 어쨌든, 데이터를 분석하는 것 만으로도 사람들에게 도움이 되는 사업을 만들어낼 수 있다는 것은 매력적인 일이기는 하다. 그리고 ‘빅데이터’를 표방하는 스타트업 대부분이 맵-리듀스(Map-Reduce) 알고리즘과 함께 한 하둡(Hadoop) 기술을 사용하고 있기에 빅데이터 회사라고 부르는 것이 무리는 아니다.

1. 텔어파트(TellApart)

텔어파트 창업자, 조쉬 맥파랜드(Josh McFarland)
텔어파트 창업자, 조쉬 맥파랜드(Josh McFarland)

텔어파트애드 리타게팅(Ad Retargeting) 회사이다. 몇달 전 빅 데이터 회사를 조사하다가 이 회사에 대해 알게 되었는데, 마침 얼마 전에 리크루터에게 연락이 온 덕에 회사에 대해 자세히 알게 되었다. 스탠포드 경제학, 구글 프로덕트 매니저 출신인 조쉬 맥파랜드(Josh McFarland)가 만들었다. 그가 창업하게 된 이야기를 인터뷰를 통해 자세히 들을 수 있었다. 2009년, 실리콘밸리의 저명한 VC인 그레이락 파트너스(GreyLock Partners)의 제임스 슬라벳(James Slavet)이 회사에 새로 영입할 파트너를 찾고 있었고, 조쉬를 영입하기로 했다. 이야기가 잘 진행된 후, 최종 합의를 하기 위해 만난 저녁 식사 자리에서 그는 파트너 자리를 수락하는 대신, 사실 창업을 하고 싶다고 이야기했다. 당시에 아이템이 정해져 있지는 않았던 것 같다. 그러자 제임스는 그에게 EIR (Entrepreneur in Residence: 벤처 투자사에서 직접 지원을 받는 창업가) 자리를 제안했고, 그는 받아들였다. 8개월간 거기서 새로운 사업을 구상하고 시제품을 만들었고, 2010년 4월에 그레이락 파트너스, SV 엔젤스, 딕 코스톨로(Dick Costolo), 리드 호프만(Reid Hoffman) 등 이름만 대면 알만한 VC와 투자자들이 $4.75M (약 50억원)을 투자하면서 본격적으로 회사가 시작되었다. 그 이후 $11M (약 120억원)의 추가 투자를 받았으며, 지금은 샌프란시스코에서 멀지 않은 벌링게임(Burlingame)에 사무실을 두고 약 50명이 일하고 있으며, 지난 12월에 연 매출(run rate)이 $100M (1,100억원)을 넘었으며 흑자를 내고 있다고 발표했다. 직원 일인당 20억원의 매출을 올리는 셈이니, 그야말로 로켓쉽(Rocketship)이라고 할 수 있다. 이미 명품 백화점 체인인 니만 마커스(Neiman Marcus), 안경과 선글래스의 역사를 새로 쓰고 있는 워비 파커(Warby Parker), 주방 용품 프렌차이즈인 서 라 테이블(Sur La Table) 등을 고객으로 가지고 있다.

여기서 애드 리타게팅(Ad Retargeting)에 대해 잠시 이야기를 해보자. 말 그대로 ‘광고를 다시 보낸다’는 뜻인데, 어떤 사람이 쇼핑 사이트에 방문해서 구매를 하지는 않고 구경만 하고 떠나는 경우 (98%의 경우 그냥 떠난다고 한다), 나중에 그 사람이 페이스북이나 지메일 등 다른 서비스를 이용할 때 브랜드와 상품을 보내서 재방문과 구매를 유도하는 것이다. 아래 그림을 보자.

Screen Shot 2014-02-02 at 11.59.50 PM
내 트위터 타임라인에 뜬 AdRoll 이라는 회사가 보낸 광고. “우리가 당신을 리타게팅하고 있습니다!”

애드롤(AdRoll)이라는 광고 리타게팅 회사 홈페이지를 들어가본 후부터, 내 트위터 타임라인에 종종 이런 광고가 뜨고 있다. 마찬가지로, TellApart의 고객사인 헤이니들(Hayneedle.com)을 방문한 후부터는 페이스북 타임라인에 줄기차게 Hayneedle 광고가 뜨고 있다.

이렇게 나한테 광고를 보낼 때 가장 중요한 것은, 내가 광고를 보낼 가치가 있는 사람인지를 판단하는 것이다. 나에게 광고를 보낼 때마다 돈이 들기 때문이다. 나에 대한 정보를 최대한 모으지 않고는 쉽지 않은 일이다. 따라서 얼마나 빠른 속도로 얼마나 정확히 나에 대해 파악하느냐가 애드 리타게팅 회사의 경쟁 우위이고, 그 분석은 ‘빅 데이터’의 영역에 속한다.

한편, 내가 방문했던 사이트에 대한 정보를 이미 가지고 있고, 그걸을 이용해서 광고를 보낸다는 사실이 좀 꺼림직하게 느껴지기도 한다. 민감한 정보를 이용해서 광고를 보낸다면 개인 정보 침해 소지가 있다. 캐나다에서는 이를 보다 엄격히 적용하는 것 같다. 한 캐나다인이 수면 곤란(Sleep Apnea) 치료기를 판매하는 웹사이트를 방문한 후부터 구글에서 계속 관련된고 광고가 뜨고 있다고 신고했고, 이것이 캐나다 정부는 개인 정보 보호법을 침해했다는 이유로 구글에 압박을 가하고 있다는 소식도 있다.

2. 클라이밋 코퍼레이션(The Climate Corporation)

클라이밋 코퍼레이션(The Climate Corporation) 웹사이트
클라이밋 코퍼레이션(The Climate Corporation) 웹사이트

2년 전쯤, 이 회사의 창업자인 데이빗 프리드버그(David Friedberg)가 2011년에 스탠포드에서 했던 강연을 듣고 이 회사에 대해 처음 알게 되었고, 그 후 회사의 리크루터에게 연락이 와서 회사 상황에 대한 이야기를 들은 후, 몇달 전 여기에서 프로덕트 매니저로 일하고 있는 사람을 만나게 되어 회사에 대해 자세히 알게 되었다.

마찬가지로 오직 ‘데이터’로 만들어진 회사인데, 이 회사가 하는 일이 참 재미있다. 창업 스토리는 데이빗의 강연에서 가장 자세히 들을 수 있는데, 그가 구글에서 일하던 시절, 어느 비가 오는 날 자전거 대여점을 지나치면서 생각했다고 한다.

이런 비가 오는 날 과연 누가 자전거를 빌릴까? 저 사람에게 날씨는 곧 매출과 직결되는 일인데, 누구보다도 정확한 날씨 정보를 수집해서 이를 팔면 돈이 되지 않을까?

사업이 되겠다는 확신이 들자, 구글을 나와 회사를 만들었고, 날씨 정보를 수집한 후 자전거 대여점과 같이 날씨가 사업 성과에 영향을 미치는 곳들을 찾아다니며 제품을 팔기 시작했다. 건축 회사, 스키 리조트, 여행사, 농부 등등… 평소에 일정액의 돈을 내다가, 매상에 큰 영향을 주는 안좋은 날씨가 닥치면 (너무 춥거나, 비가 오거나) 즉시 돈을 지급받게 된다는 아이디어였다. 일종의 보험 상품이다.

결과는 저조했다. 날씨에 관심이 많은 것과 돈을 주고 보험과 비슷한 상품을 가입한다는 것 사이엔 간극이 있었다. 고생 끝에 그는 시장을 발견한다. 바로 아이오와(Iowa) 주의 농부들이다. 작은 기후 변화에도 그들의 농작물은 큰 영향을 받았고, 그들은 이미 보험에 가입해 있었으므로 이 상품을 곧바로 이해했다. 회사는 오직 농부들만 대상으로 하기로 하고 상품을 더욱 특화시켰다. 결과는 대성공이었다.

보험 상품과 비슷하다고 했는데, 한 가지 큰 차이점은, 이 회사는 보험과 달리 ‘보험금 신청’의 과정이 없다는 것이다. 회사가 미국 전역의 모든 기후 변화를 모니터링하다가, 이상 기후가 발견되면(일정 온도 이하로 내려가거나, 일정 습도 이상으로 올라가거나) 자동으로 가입자 통장으로 돈을 입금한다. 이 편리함이 많은 고객들의 공감을 샀다.

몇달 전인 2013년 10월에 Monsanto에 $1.1B (1.2조원)의 매우 높은 가격에 인수되었고, 창업자 데이빗은 물론 갑부가 되었다.

3. 스마트집(SmartZip)

스마트집
스마트집 홈페이지

미국에서 부동산 거래를 할 때 대부분 리얼터(realtor) 또는 브로커(broker)라고 하는 사람의 도움을 받는다. 그 역할은 나두(nadoo)에 포스팅된, ‘미국에서 집 사는 과정 한 눈에 보기‘라는 글에서 그 과정을 자세히 볼 수 있는데, 한국에서의 중개업자와는 좀 다른 면이 있다.

첫째, 집을 사거나 팔게 되기까지 시간을 훨씬 많이 쓴다. ‘삼성래미안 24평 6억 8천. 내년 3월 입주 가능합니다’ 이런 식이 아니다. 집마다 생긴 모양이 다 다르고 스타일이 다 달라, 고객이 원하는 집을 찾기까지 훨씬 많은 시간을 쓰게 된다. 집을 팔 때도 마찬가지이다. 그냥 사는 집을 그대로 보여주고 파는 일은 거의 없고, 리얼터가 사람을 고용해서 집을 그럴 듯하게 꾸민 후 ‘오픈 하우스’라는 것을 한다. 관심 있는 사람들이 와서 집을 보고 질문을 하는 시간이다.

둘째, 수수료가 훨씬 높다. 사는 쪽, 파는 쪽 중개인 각각 3%씩 가져간다. 관행상 집을 파는 쪽에서 6%를 지급하고, 이를 리얼터 둘이 3%씩 나누어 갖는다. 캘리포니아에서 웬만한 집은 가격이 $1M (약 11억원) 이상이고 샌프란시스코, 팔로 알토, 쿠퍼티노 지역에서는 $3M짜리 집도 흔히 볼 수 있는데, $3M 짜리 팔면 부동산 중개업자가 각각 $9K, 즉 거의 1억 원을 가져간다. 집 하나 팔고 1억을 버는 것이니 나쁘지 않은 셈이다.

집을 사는 사람을 대표하는 것보다 파는 사람을 대표하는 것이 훨씬 시간이 적게 들기 때문에, 당연히 모든 리얼터들이 집을 파는 사람을 위해 일하고 싶어한다. 문제는 매물로 나오는 집의 숫자가 리얼터 숫자보다 훨씬 적다는 것. 그래서 집을 파는 사람을 잡기 위해 리얼터들은 자신의 이름을 알리기 위해 갖가지 마케팅 활동을 벌인다.

스마트집(Smartzip)은 바로 이 문제를 해결한다. 그들은 집과, 그 집에 살고 있는 사람들에 관한 모든 정보를 다 모은다. 언제 얼마에 구입했는지, 방은 몇 개인지, 고속도로에서 얼마나 가까운지, 마당은 얼마만한지, 집 주인은 몇 식구인지, 가구 소득은 얼마인지 등등이 그러한 정보이다. 집마다 최고 2000개까지의 속성을 모았다고 한다. 이 모든 정보를 이용해서 그들이 하는 일은 ‘예상 분석(Predictive Analytics)’이다. 즉, 향후 6~12개월 이내에 매물로 나올 것 같은 집을 미리 찾아내는 것이 알고리즘의 핵심이다. 그 구체적인 방법은 아래와 같다. 사실은 아주 일반적으로 사용되는 데이터 마이닝(Data Mining) 방법이다.

  1. 평소에 집과 가구에 관한 정보를 모아둔다.
  2. 집이 매물로 나오면 매물로 나온 집의 절반을 이용해서 6~12개월 전에 그 집에서 발생한 사건들을 이용해 알고리즘을 ‘학습’ 시킨다.
  3. 학습된 알고리즘을 다른 절반의 집들에 대입해서 알고리즘이 얼마나 효과적인지 알아본다.
  4. 학습된 결과가 꽝이면 알고리즘을 수정해서 다시 대입한다. 알고리즘이 품질이 최고가 될 때까지 반복한다.
  5. 정확도가 어느 정도 나오면, 아직 매물로 나오지 않은 집의 정보를 알고리즘에 대입한다.
  6. ‘조만간 팔릴 가능성이 높은’ 정도를 점수로 계산한 후 순위를 매긴다.

그들의 리스트가 얼마나 정확한지는 모르겠으나, 그들의 주장에 따르면, 순서에서 상위 20%에 해당하는 집들은 1년 내에 40~50%의 확률로 매물로 나온다고 한다. 그것이 사실이라면 황금의 값어치를 가진 리스트가 되는 것이다. 리얼터들이 기꺼이 돈을 주고 살 것이다. 실제로 많은 리얼터들이 돈을 내고 서비스를 이용하고 있으며, 큰 효과를 보았다고 증언하고 있다.

이처럼, 많은 빅데이터 회사들은 ‘머신 러닝(Machine Learning)‘이라는 기법을 사용한다. 내가 MBA에서 가장 흥미롭게 들었던 과목이며, 더 알고 싶어서 코세라(Coursera)에서 숙제까지 하면서 배웠던 내용이기도 하다. ‘머신 러닝’이라는 단어에서 추측할 수 있듯, 대량의 데이터를 통해 알고리즘을 ‘훈련(training)’시킨 후, 이를 바탕으로 새로운 유추를 하도록 만드는 것인데, 때로는 어처구니 없는 결과가 나오기도 하지만, 많은 경우 깜짝 놀랄만큼 정확도가 높아 점차 많은 분야에 적용되고 있다.

4. C9

C9 홈페이지
C9 홈페이지

이 회사가 하는 일은 설명이 쉽지 않은데, 그들은 자신을 매출 퍼포먼스 회사(Revenue Performance Company)라고 부르고 있다. 여러 가지 제품을 만들었는데, 그 중 핵심은 ‘매출 예측‘이다. 앞서 소개한 회사들과 마찬가지로 머신 러닝(Machine Learning)을 이용해서 데이터를 분석하는데, 진행중인 딜(deal)들이 가진 속성들을 이용해서 그 딜이 완결(closing)될 확률이 몇 퍼센트인지를 계산한 후, 이를 이용해서 분기 또는 연 매출을 추정하는 것이다. 분기 매출을 정확히 추정하는 것은 매우 어려운 문제 영역에 속하며, 이를 얼마나 정확히 할 수 있느냐가 회사의 수준을 말해줄 만큼 중요한 일이다.

회사에 100명의 판매 사원들이 있다고 하자. 이들이 진행중인 딜(deal)이 수백개에 달한다고 하자. 딜마다 진행 상태가 모두 다를 것이다. 어떤 딜의 경우 이제 막 구매 담당자를 만났을 수도 있고, 어떤 딜은 이야기가 잘 진행되어 계약 직전인 경우도 있으며, 어떤 딜은 몇 년 전부터 구워삶았으나 진행이 잘 안되고 있을 수 있다. 어떤 경우엔 전화 한 통으로 거래가 성사되기도 하며, 어떤 경우엔 한참 정성을 들여야만 거래가 성사되기도 한다. 과거의 모든 거래에서 발생했던 역사적(historical) 정보를 모아서, 이를 분석해서 알고리즘을 만든 후, 현재 진행중인 거래에 대입시켜 미래의 매출을 추정하는 것이다.

이미 링크드인(LinkedIn), 판도라(Pandora)와 같은 회사를 고객으로 두고 있으며, 지속적인 성장성이 보이는 회사이다.

5. 캐글(Kaggle)

캐글(Kaggle.com) 홈페이지
캐글(Kaggle.com) 홈페이지

구글(Google)과 철자와 발음이 비슷해서 외우기 쉬운 회사 캐글(Kaggle). 이 회사가 하는 일은 데이터 사이언티스트(Data Scientist)와 그들의 능력을 필요로 하는 회사들을 연결시켜주는 것이다. 웹사이트에 흥미로운 과제들이 많이 올라와 있는데, 몇몇 과제들엔 큰 상금이 걸려 있다.

GE와 알래스카 항공(Alaska Airlines)은 가장 큰 고객 중의 하나인데, 그들이 만든 총 상금 25만 달러가 걸려 있었던 비행 퀘스트(Flight Quest) 1이 작년에 종료되었고, 총 상금 22만 달러가 걸린 두 번째 과제는 조만간 제출 마감을 앞두고 있다. 알래스카 항공이 가진 수많은 데이터를 분석해서, 항공기 조종사들이 보다 효율적으로, 연착 없이 운행할 수 있도록 도와주는 것이 과제의 목표이다. 데이터 안에는 날씨를 비롯한 수많은 변수들과, 각 상황에서 비행기가 얼마의 시간이 걸려 도착했는지, 연착이 되지는 않았는지 등의 정보가 들어 있다. 첫 번째 과제에서는 173개 팀, 236명의 데이터 사이언티스트들이 경쟁을 했고, 상금 5만 달러를 차지한 2등 우승자들이 등장한 비디오에 따르면, 둘이 한 팀을 이루어 총 300시간 이상을 썼다고 한다.

현재에도 다양한 재미있는 과제들이 올라와 있는데, 그 중 하나는 런던 왕립 대학(Imprial College London)에서 올린 ‘대출금 부도(loan default)’를 추정하는 과제이다. 20만 명의 고객 데이터가 제공되며, 데이터 안에는 그 고객들이 대출을 받을 때 상황이 어땠는지, 나중에 대출금을 잘 갚았는지, 아니면 부도(default)를 냈는지, 그 경우 손실액은 얼마나 컸는지 등의 정보가 들어 있다. 가장 추정을 잘 하는 알고리즘을 만든 팀이 이기며, 상금 1만 달러를 가져간다.

창업자인 안소니 골드블룸(Anthony Goldbloom)은 호주 출신으로 1983년생이며, 2010년에 캐글을 만들어 $11.25M(약 120억원)의 투자를 받았다. 투자자들이 이익을 볼 정도로 큰 성공을 거둘 것 같지는 않지만, 어쨌든, 전 세계 데이터 사이언티스들이 모여 실력을 뽑내는 흥미 있는 장터를 만들어냈다는 점에서 높은 점수를 줄 만하다.

6. 매터마크(Mattermark)

매터마크 서비스 화면
매터마크(Mattermark.com) 서비스 화면. 비상장 회사에 관한 모든 정보를 모아두었으며, 핫(hot)한 정도에 따라 점수가 매겨져 있다.

이 회사는 ‘빅데이터 회사’라고 부르기엔 무리가 있지만, 어쨌든 데이터를 모아서 가공해서 파는 스타트업이다. 이 회사가 하는 일은, 상장 전 회사들의 정보를 최대한 모으고(직원 수, VC 투자 정보, 웹사이트/모바일 앱 인기 순위, 소셜 네트워크 지수 등), 이를 이용해서 ‘핫(hot)한 회사들’ 순위를 메기는 것이다. 아는 사람이 이 회사의 첫 번째 직원으로 들어가게 되면서 회사에 대해 자세히 알게 되었고, 유료 회원으로 가입해서 얼마간 써보기도 했다. 비상장 회사들, 즉 스타트업들에 대해 놀랄만큼 많은 정보를 모아두어서 아주 유용했다. 그들의 주 고객은 VC(벤처캐피털)들이며, 비용은 1인당 월 500달러인데, 이미 많은 VC들을 고객으로 확보한 상태이다.

VC들이라면 이런 회사 분석은 이미 하고 있으리라 생각되지만, 그건 규모가 큰 VC들이 할 수 있는 일이고, 많은 작은 규모의 회사들은 엄두를 내기 힘들다. 그 틈을 매터마크가 채워준다. 꼭 VC들만 고객이 되라는 법은 없다. 인수할 회사들을 찾는 프라이빗 에쿼티(Private Equity) 회사들, 또는 대기업에서 인수 합병을 담당하는 부서들이 고객이 될 수 있다.

이 회사가 서비스를 개시하자마자 유료 고객을 확보하게 된 데에는 창업자인 다니엘 모릴(Danielle Morrill)의 역할이 크다. 크런치베이스(crunchbase) 프로필에 따르면 고등학교가 최종 학력이라고 소개하고 있는데, 링크드인 프로필에 고등학교 졸업 연도가 2003년으로 되어 있으니 꽤 젊은 창업자인 셈이다. 실리콘밸리에서 활발한 활동을 통해 널리 알려진 사람이며, 특히 그녀의 블로그가 유명하다. 글을 참 잘 쓴다. 지금 회사를 창업하기 전에 리퍼리(Referly)라는 회사를 만들었었는데, 회사를 운영하다가 성장이 더뎌 사업을 접기로 결정하면서 쓴 블로그 글이 큰 반향을 일으키면서 그녀의 이름이 널리 알려진 것 같다. 매터마크 홈페이지에서 뉴스 레터를 구독하면 그녀가 읽고 나서 정리한 글들을 매주 받아볼 수 있는데, 내가 빼놓지 않고 꼭 확인하는 글 중 하나이다.

샌프란시스코 고층 빌딩에 사무실을 두고 있으며, 팀 소개 페이지가 꽤 멋지게 꾸며져 있다. 정보를 모으고 가공하는 것으로 한 고객당 월 500달러를 꾸준히 받고 있고, 이미 고객도 많이 확보한 상태라고 하니 앞으로의 성장이 기대가 된다.

7. 루모써티(Lumosity)

역시 같은 범주에 들어가지는 않지만, 마찬가지로 데이터를 기반으로 만들어진 모델이다. 일정 나이가 되면 뇌의 신경망이 굳어져버려 더 이상 머리가 좋아지는 것은 불가능하다는 과거의 이론과 달리, 뇌는 유연(malleable)하며 바뀔 수 있다(plastic)는 뉴로플라스티시티(Neuroplasticity) 이론을 바탕으로, 뇌를 ‘훈련’하는 것을 도와주는 서비스이다. 이 서비스에 대해 최근에서야 알게 되어 돈을 내며 한 달간 써봤는데, 처음엔 무척 시시하더니 난이도가 점점 올라가서 요즘엔 꽤 흥미가 있다. 더 써봐야 알겠지만, 두뇌 훈련에 도움도 좀 되는 것 같다.

속도(Speed), 기억력(Memory), 집중력(Attention), 유연성(Flexibility), 문제 해결력(Problem Solving)의 다섯 가지 분야로 나누어, 각 분야마다 다양한 게임들이 있다. 예를 들어, 내가 가장 좋아하는 기억력 게임 중 하나가 핀볼 게임인데, 아래 화면처럼, 핀들이 여러 개 화면에 나타난 후에 완전히 사라진다. 그리고 모서리 중 한 곳에서 공을 쏘게 될 것이라는 표시가 나온다. 이제 핀들이 어디 있었는지를 기억해내어서, 공이 여러 번 튄 후 최종 어디에 도착하는지를 맞추는 것이 목표이다. 핀 수가 많아지고, 튀는 횟수가 늘어날수록 꽤 맞추기가 어려워진다.

핀볼 게임
루모써티 게임 중 하나인 핀볼 게임

테크크런치에 실린 인터뷰 비디오에 따르면, 창업자인 마이크 스캔론(Mike Scanlon)은, 어렸을 적 할아버지가 알츠하이머 병에 걸려 돌아가신 것을 보았던 것이 창업의 계기가 되었다고 설명한다. 어떻게 하면 그런 일을 방지할 수 있을까에 관심을 가지던 그는, 스탠포드 대학에서 뇌 과학(Neuroscience)을 공부하면서 뇌 훈련에 도움을 줄 수 있는 이론들이 연구되어 있었지만 그것들을 이용해서 실질적으로 사람들을 돕는 서비스를 만든 사람이 없었기에 자신이 만들었다고 한다.

가족이 알츠하이머를 통해 고생하는 것을 목격한 스탠포드 출신 뇌 과학자가 만든 서비스라는 점 덕분인지 몰라도, 2007년에 시작된 이 서비스는 2013년 4월 기준으로 4천만명의 회원을 확보하고 있다. 서비스 사용료가 월 12달러에 달한다는 점을 생각하면 매출이 상당할 것 같다. 마찬가지로 지속적인 성장이 예상되는 회사이다.

빅 데이터의 미래

며칠 전 아마존(Amazon)이 예측 배송(Anticipatory Shipping)이라는 제목의 특허를 등록한 것이 알려지면서 화제가 되었다. 고객이 주문 버튼을 누르기도 전에, 주문을 할 지 안할 지를 예측해서 고객 근처의 물류 센터로 배송을 시작하는 기술이라고 한다. 주문을 하는 시점에는 이미 가까이 물건이 와 있으므로 훨씬 빠르게 배송할 수 있다는 논리이다. 데이터 분석을 통해 고객 취향을 알아내는 것도 모자라 구매 예측까지 한다니, 아마존이 정말 세계를 지배할 모양이다. 등록된 특허를 여기에서 볼 수 있는데, 대강 읽어보니, 최종 배송 주소를 모르는 상태에서 일단 근처까지 물건을 보내고, 물건이 배달되는 과정에서 주소가 정해지면 그 때 정확한 주소로 물건을 배송하는 것이 주된 내용으로 되어 있다. 만약 근처 물류 센터까지 보냈는데 결국 고객이 주문을 안 한 경우, 그 물건을 중앙 물류 센터로 다시 가져오는 비용과, 그냥 고객에게 보내는 데 드는 비용을 비교해서 후자가 더 쌀 경우엔 고객에게 공짜로 배송한다는 내용도 포함되어 있다. 주문도 안했는데 아마존이 예측해서 마침 필요한 걸 보내준다면 소름이 돋을 것 같다.

미래에는, 스타벅스 가는 길에 자기가 주문하려고 생각했던 커피가 만들어져 있고, 백화점 가는 길에 자기가 살 옷이 마련되어 있고, 식당에 가는 길에 자기가 시킬 메뉴가 만들어져 있지는 않을까? 그건 좀 과장이지만, 어쨌거나, 인간의 신성한 자유 의지를 자꾸 알아내어서 예측하려 하고 있다는 게 꼭 달갑지만은 않다.

14 thoughts on “주목할만한 실리콘밸리의 ‘빅 데이터’ 스타트업 7개

  1. 빅데이터의 활용이 참으로 많네요…
    마지막 문구처럼 인간의 신성한 자유 의지를 자꾸 알아낸다는 것만으로도….저 또한 달갑지는 않지만요…
    그 끝이 어떨지 궁금하게 만드네요.. 좋은 지식 정보 감사합니다.

  2. 2009년에 클라이밋 코퍼래이션과 아주 흡사한 형태의 사업을 생각했었습니다. 정신나갔냐는 소리를 하던 친구들이 생각나네요. 상상의 범주에서 벌어지던 일들이 현실로 나타난다는건 참 멋진 일인 것 같습니다.

    1. 저희 이스라엘 파트너 Meteo-logic은 일기예측 시스템 기술을 가지고 있습니다. 홍콩 최고재벌인 리카싱이 설립한 Horizen Ventures로부터 많은 투자금을 받은 회사입니다. 클라이밋 코퍼래이션이 1.2조에 팔렸다면 Meteo-logic은 2~3조에는 팔려야 할 듯 하네요. 국지적인 지역의 1~2시간 내의 일기예측까지 정확하니까요.
      http://www.meteo-logic.com

  3. ‘빅데이터’라기 보다는 ML이나 알고리즘을 이용한 사업이라고 해야하는게 더 맞을듯 합니다. 데이터의 양이 정량적으로 어느정도 처리하고 보유해야하는 서비스인지가 없기 때문이지요.

  4. 헐.
    구매예측에 대해서 그리고 인간의 자유의지를 예측한다는 끝문장읽고 소름이쫙..서늘했네요 ㅎㅎ

    흥미로운 정보 고맙습니다~^^

  5. 7번 기업의 아이템같은 경우, 수년전에 한바탕 국내에도 바람이 불었던 아이템인데요.(닌텐도DS 두뇌트레이닝) 나름 식상하다면 식상한 아이템인데, 어떻게 차별화 해서 사업을 성공 시켰는지 궁금하네요.. 게임성으로 승부한것인지, 아니면 고객맞춤전략이 있는건지.

    1. 닌텐도 두뇌트레이닝에 대해서는 저도 알고 있는데, 게임성으로 승부했거나 ‘고객 맞춤 전략’이 있다기보다는, 좀 더 믿을만하다는 생각이 들어요. 두뇌트레이닝은 그냥 게임 정도로 느껴지고, 이건 보다 과학적으로 접근한 게임이라는 느낌. 게임 끝날때다 BPI(Brian Performance Index) 값을 보여주는데, 게임해보면 BPI가 꽤 정확한 값이라는 것을 알게 되죠. 이걸 비슷한 나이대의 다른 사람들과 비교해보면서 자기가 어디 있는지 알게 되구요. 그래서 아깝지 않게 돈을 내게 됩니다.

  6. 좋은 글 감사드립니다.
    궁금한 점이 있는데 질문을 좀 드려도 괜찮은지 모르겠네요.

    흔히 말하는 이런 빅데이터 회사들은 가공하려는 데이터를 어떤식으로 수집하는 것인지 궁금합니다.
    단순한 정보도 아니고 엄청난 용량의 데이터일텐데 이런 데이터를 어떻게 확보하는지 궁금하네요. 예로 든 회사중 매터마크라는 회사는 직원 수, VC 투자 정보, 웹사이트/모바일 앱 인기 순위, 소셜 네트워크 지수 등의 데이터를 모은다고 하는데 이런 데이터를 어떻게 어디서 얻는 것인지

    또 클라이밋 코퍼레이션 같은 경우는 정확한 날씨 예측을 위해 필요한 날씨 데이터를 어떤식으로 맨 처음 얻게 되는 것인지 궁금합니다.

    1. 답변이 늦었습니다. 저도 정확히 그 부분이 궁금했었는데요, ‘클라이밋’ 같은 경우, 날씨 데이터 수집 경로는 사실 매우 다양합니다. 그런 정보만 모으는 서비스로부터 돈을 주고 사기도 하고(대부분 이렇게 할겁니다), 고객들에게 앱을 깔게 해서 직접 모을 수도 있고, 직접 날씨 정보 수집기를 설치해서 모을 수도 있지요. 미국의 경우, 구글 덕분인지 원래 습성인지 몰라도 정보를 잘 모아서 가공해서 파는 일만 하는 서비스들이 참 많아서 정보 수집은 그렇게 큰 허들이 아니었을 것 같습니다. 문제는, 각기 다른 소스에서 얻은 정보를 합치는 데서 나오지요. 포멧이 다른 건 변환이 쉽지만, 때로는 정보를 모으는 방식이나 정확도가 다른 경우는 정보 변환에 노력이 필요합니다.

  7. 잘은 모르지만 Palantir도 이 쪽 분야에서 꽤나 주목받는 기업 아닌가요? 이쪽 분야 관련 기사엔 항상 언급 되는 것 같던데..

Leave a Reply

Please log in using one of these methods to post your comment:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s