“사진 속 강아지 구분해내는 이미지 인식 기술, 실리콘밸리에도 뒤지지 않습니다” – 클디 백승욱 대표 인터뷰
8월 27, 2014

클디(cldi)는 스타트업이 도전하기 어려운 분야인 '이미지 인식 기술'을 개발하고 있는 곳이다. 구글의 이미지 검색도, 페이스북의 태그 기능도 모두 이 이미지 인식 기술의 일부다. 이처럼 세계를 이끄는 IT 기업들이 관심을 보이고 있는 이미지 인식 기술 분야에서 클디는 세계적 수준의 역량을 보여주며 최근 케이큐브벤처스로부터 1억 원의 투자를 유치했다. 클디 백승욱 대표를 만나, 그들의 기술과 포부에 대해 물었다.

Cldi (2)▲좌측부터 이정인 CTO, 백승욱 대표, 김효은 연구원

- 먼저, 클디 서비스에 대해 간략한 소개를 부탁드립니다.

클디는 딥러닝(deep learning, 심층학습)이라는 머신 러닝 기술을 이용하여 이미지로부터 관련 정보들을 인식하는 기술을 개발하는 스타트업입니다. 예를 들어 특정 옷의 이미지를 컴퓨터에게 보여주면, 그 사진에서 옷의 종류와 특징들을 인식해서 비슷한 상품들을 추천해 준다거나 내 개인 사진들 중에서 강아지와 찍은 사진만을 골라서 보여주는 등의 일들이 가능해집니다.

한마디로 이야기해서, 이미지를 1차원적으로 보는 것이 아니라, 컴퓨터가 이미지 안의 구성 요소들을 인식하는 것이라고 할 수 있어요. 이를 위해서는 높은 정확도를 가지는 인식 기술이 필요한데 딥러닝이라는 방법을 통해 구현해 낼 수 있다고 생각합니다. 현재는 인식 기술 자체를 갈고 닦는데 온 힘을 기울이고 있고 내년에는 비즈니스 모델을 갖춘 서비스를 출시할 계획입니다.

cldi_demo▲클디의 이미지 인식 기술 데모 버전

- 상당히 독특한 서비스인 것 같은데, 어떤 계기로 클디를 시작하게 되셨나요.

제가 2009년 대학교에서 이미지 인식 기술을 처음 접하고 나서, 이게 세상에 줄 수 있는 가치가 정말 크다는 것을 느껴 꾸준히 연구를 지속해 왔어요. 2012년 딥러닝을 알게 되고 나서 그 생각이 더욱 강해졌고요. 특정 시장 기회를 포착했다기보다는 이러한 인공지능 기술이 컴퓨팅의 필연적인 발전방향이라는 확신이 있었기 때문에 창업을 결정할 수 있었습니다.

- 현재 딥러닝이라는 기술의 현황이나 시장 규모는 어떠한가요?

딥러닝을 이용한 이미지 인식 기술은 사람이 직접 눈으로 보고 판단하는 과정이 필요했던 수많은 분야에 적용될 수 있어 시장 규모를 특정하기 어려울 정도입니다. 굉장히 방대하죠. 결국 기존의 이미지 인식 기술 시장을 목표로 하기보다는 신규 시장을 창출할 수 있다는데 더 큰 가치가 있어요. 특히 과거의 인식 방법들로는 속도나 정확도의 한계로 존재할 수 없었던 시장들이 이 기술을 통해 열릴 수 있습니다.

딥러닝은 최근에 학계에서 가능성을 인정받아 이제서야 서서히 산업계에 적용되어가고 있는 기술이에요. 그래서 현재는 딥러닝 기술 자체를 판매하는 API 시장이 주를 이루고 있죠.  향후에는 딥러닝 플랫폼 시장 외에 특정 사업 영역에 특화된 다양한 인식 기술 시장도 함께 성장할 것입니다.

- 이미지 분석을 위한 데이터는 직접 만드시는지 수집하시는지 궁금합니다. 수집하신다면 어떤 방식으로 하고 계신가요?

데이터는 다양한 방법으로 모으고 있어요. 현재 홈페이지에 올라와 있는 데모는 학계에 널리 알려져 있는 이미지넷 데이터 세트라는 것을 통해 학습된 것입니다. 그 외에도 여러 주제의 이미지들을 인터넷에서 모으고 있어요.

이미지를 많이 모으는 것도 중요하지만 이미지의 의미를 태깅하는 작업도 굉장히 중요한데, 현재는 저희 팀에서 직접 진행하고 있습니다. 서비스를 위한 태깅은 차후 자체 태깅 팀을 구성해서 진행할 계획입니다. 비즈니스 측면에서는 데이터가 가장 중요하기 때문에 자체 데이터를 확보하는데 앞으로도 많은 투자를 할 계획이에요.

- 해외에 클디와 유사한 회사들 중 좋은 성과를 내고 있는 기업은 어디가 있나요.

해외 스타트업들은 기술 수준을 높이는데 집중하거나 기술 자체에 대한 플랫폼을 제공하는 회사들이 주를 이루고 있어요. 이미지 인식 분야에서 가장 높은 정확도를 보유하고 있는 업체는 클래리파이(Clarifai) 인데 이 곳은 아직 제품을 출시하지 않고 인식 성능 향상에 집중하고 있습니다. 알케미API(AlchemyAPI)는 딥러닝을 이용한 텍스트, 이미지 분석 서비스를 제공하고 있고 에르사츠랩스(Ersatz Labs)는 고객이 자신의 데이터를 이용해서 딥러닝 학습을 직접 할 수 있게 해주는 클라우드 서비스를 제공하고 있습니다.

Screen-Shot-2014-06-06-at-FridayJun-69.43-AM-900x510▲경쟁사 클래리파이의 이미지 자동 태깅 기술

- 그 회사들과 비교할 때 클디만의 차별점과 강점은 어디에 있을까요. 

클디의 차별성은 특정 영역에 특화된 딥러닝 기술을 이용하여 서비스까지 만들어 내는 것에 있어요. 기초 체력이 되는 인식 기술은 세계수준을 유지함과 동시에 제품은 버티컬한 영역에 집중할 것입니다. 내년 하반기 출시를 목표로 몇 가지 사업 영역을 검토 중에 있으나 아직 공개할 만한 수준은 아닙니다. 현재는 내부 딥러닝 시스템을 탄탄하게 만드는데 더 많은 노력을 기울이고 있습니다.

- 클디의 구체적인 비즈니스 모델이 무엇인지 궁금합니다.

아직은 자체 데이터를 이용한 서비스의 기획이 진행 중이기 때문에 비즈니스 모델이 구체화 되지는 않았어요. 파트너사의 데이터를 이용한 전용 인식 엔진을 라이센스 하는 B2B 형태의 비즈니스도 계획하고 있습니다.

- 향후 클디 기술의 확장 방향에 대해 설명을 부탁드립니다. 

딥러닝의 장점은 데이터의 종류에 따른 맞춤형 고성능 인식 엔진을 만들 수 있다는 것입니다. 클디는 탄탄한 딥러닝 기술에 기반하여 인식 가능한 데이터의 영역을 조금씩 넓혀나가는 방향으로 기술을 확장시켜 나갈 계획이에요.

- 마지막으로, 클디의 최종적인 목표와 꿈은 무엇인가요.

클디의 비전은 인간보다 더 나은 컴퓨터를 만드는 것입니다. 인간은 주관적이지만 컴퓨터는 데이터에 기반한 객관적인 판단을 할 수 있죠. 뛰어난 인지 시스템을 통해 직접 인간의 눈으로 봐야만 가능했던 일들을 빠르게 처리할 수 있다면 인간은 더 가치 있는 곳에 시간을 쓸 수 있을 거예요. 한마디로, 비서 같은 컴퓨터를 만드는 것이 클디의 꿈이라고 할 수 있습니다.

정 새롬
노력과 겸손, 지혜가 담긴 글을 쓰도록 노력하겠습니다. 찰싹찰싹 피드백 부탁드립니다.

익명 댓글

avatar