다큐먼트 AI 팩, AskUp Seargest 첫선
올해 상반기 50억 규모 계약 이미 확보
내년 손익분기 달성 목표… 수출 물꼬 터
‘AskUp 레몬 스파클 하이볼’ 음료 출시

[천지일보=손지하 기자] 업스테이지가 16일 서울 중구 페럼타워 페럼홀에서 AI로 세상을 이롭게 한다는 컴퍼니 미션인 ‘Making AI Beneficial’을 모토로 기자간담회를 진행하고 있다. ⓒ천지일보 2023.05.16.
[천지일보=손지하 기자] 업스테이지가 16일 서울 중구 페럼타워 페럼홀에서 AI로 세상을 이롭게 한다는 컴퍼니 미션인 ‘Making AI Beneficial’을 모토로 기자간담회를 진행하고 있다. ⓒ천지일보 2023.05.16.

[천지일보=손지하 기자] 국내 AI 대표 스타트업 업스테이지가 16일 창사 첫 기자간담회를 개최했다. OCR 기반 ‘다큐먼트 AI 팩’, 국가대표 Chat AI ‘AskUp’과 검색·추천 기술을 결합시킨 ’AskUp Seargest’를 선보였다. 고성능의 맞춤 AI를 누구나 편리하게 사용하도록 돕겠다는 비전을 밝혔다.

업스테이지는 16일 서울 중구 페럼타워 페럼홀에서 AI로 세상을 이롭게 한다는 컴퍼니 미션인 ‘Making AI Beneficial’을 모토로 기자간담회 ‘Press Stage’를 개최했다. 업스테이지는 자사의 AI 팩, AskUp Seargest 등의 서비스를 소개했다.

간담회를 주관한 김성훈 대표는 기업 DX AI 솔루션 ‘업스테이지 AI 팩’, 100만 이용자를 확보한 챗 AI ‘AskUp’을 통해 글로벌 AI 생태계를 리딩하는 스타트업으로 발돋움하겠다는 의지를 피력했다.

김성훈 대표는 먼저 세계 최고 수준의 AI 전문가 팀인 업스테이지 주요 구성원들과 이들이 만든 글로벌 톱 연구 성과 및 고객 만족 사례들을 소개했다.

특히 이런 최고의 성과를 이룬 팀이 합심해 만들어낸 ‘다큐먼트 AI 팩’과 ‘AskUp Seargest’를 전격 공개하며 실제 솔루션 시연도 진행했다. AI 팩은 기업의 비즈니스 문제를 AI 기술로 해결할 수 있는 업스테이지의 노코드-로우코드 솔루션이다. 다양한 산업의 기업들이 손쉽게 AI 모델과 시스템을 구축하고 운영할 수 있도록 지원한다.

김성훈 대표는 AI 팩을 통해 고객의 비즈니스 문제를 정확하게 파악해 최적의 AI 모델과 시스템을 구축하고 지속적인 성능 개선과 유지 보수를 지원한다고 밝혔다.

‘다큐먼트 AI 팩’은 금융, 보험, 의료 등 다양한 산업에서 활용될 수 있는 업스테이지 대표 문서 AI 솔루션이다. OCR 기술을 통해 이미지나 PDF 형식의 문서를 텍스트로 변환하고 자연어 처리(NLP) 기술을 통해 반복된 수작업을 제거하고 필요한 문서의 내용을 추출하거나 분석 및 요약할 수 있다.

이와 함께 기자간담회에서 처음 선보인 ‘AskUp Seargest’는 검색과 추천 기술(Search+Suggest)을 활용해 초개인화된 추천을 채팅의 형태로 제공할 수 있는 솔루션이다. ‘AskUp Seargest’는 쇼핑, 여행, 영화, 서적 등 다양한 도메인과 시나리오에 적용할 수 있다. 고객 서비스, 마케팅, 교육 등 다양한 분야에서 활용될 수 있다.

다음은 이날 김성훈 대표, 김재범 리더, 이활석 CTO, 권순일 사업총괄과 진행한 일문일답이다.

-AskUp Seargest는 고객사 내부 DB만 서치하는지, 외부 DB까지 하는지? 외부 DB 서치라면 저작권 문제는 어떻게 해결할 건지.

이활석=고객사 DB 내에서 처리 중이다.

김성훈=저희가 가진 안전하게 만들어진 추천 엔진의 데이터는 외부로 나가지 않고 개인에게 원하는 정보를 주게 된다.

-AskUp Seargest는 최신 정보, 개인화된 게 특징인데 바드나 빙과의 차별점은 무엇인가? 개인화된 걸 제공하려면 개인의 데이터를 축적해야 가능할 텐데 어떻게 가능한지.

김재범=교보문고에 새로운 책이 나온다. 신간 정보를 검색할 수 있다는 의미다. 개인화 정보 관련해 저희가 가진 정보는 교보문고 유저 아이디를 고객사가 인코딩한 정보를 갖고 있다. 그 정보와 저희가 가진 정보는 고객을 특정할 수 없다. 보안이 엄격하게 관리되고 있다. 활용이나 오용 여지는 전혀 없다.

김성훈=최근에 개발한 추천 엔진은 유저가 필요 없고 전체 통계, 제품 사용 순서만 있으면 그 정보만 갖고 추천한다. 이것만 가지고도 좋은 품질의 추천을 만들 수 있다.

-‘AskUp Seargest’ AI의 BM은 무엇인가? 다른 기업들과 협업하는 구조인데 수익 모델은 공유하는가? 교보문고 외 다른 기업 협업 제의나 시나리오가 있다면?

권순일=3개 BM 생각 중이다. 고객사 내에 붙여서 엔드 유저가 사용하게 되는 경우, AskUp 채널에 붙이는 경우, 사내 망에서만 쓰는 경우를 생각하고 있다. 뒷단에 DB 구축을 따로 해두고 있는데 실제 고객의 활용사례를 어떻게 할 것인지, 고객이 어떻게 수익화할 건지 연동해 과금하는 구조다. 아직 기획 단계여서 회사명을 밝힐 순 없다.

-손익분기를 내년에 넘겠다고 했는데 구체적으로 내년 언제가 될지 말해달라.

권순일=내년 전체 목표라서 내년 말이 될 거 같다. 작년 60억원의 매출, 상반기 50억원의 매출을 확보했다. 내년에는 달성할 수 있겠다 생각했다. 자신감이 있으니까 글로벌 진출 발판을 마련한다는 전략을 진행하는 것.

-메신저가 잘 활용되지 않는 국가에서는 어떻게 진출할 것인지.

권순일=라인 같은 경우는 동남아에도 많이 진출했다. 일본에서 잘되면 확대할 것이다. 도큐먼트 AI는 별개의 전략으로 진출 국가를 살피고 있다. 일본이 비정형 문서나 이미지 문서가 많다 보니까 진출 목표가 겹쳤다. 다른 국가는 아직은 찾아보는 단계다.

이활석=데이터만 잘 준비되면 언어를 몰라도 커버가 가능하다. 언어 확장성 측면에서도 할 수 있다고 보고 있다.

-AI 기술을 활용하는 게 꼭 채팅일 필요는 없는데 OCR이 아닌 다른 쪽으로 갈 계획은 없는지.

김성훈=이미지 그리기 예를 들었던 것처럼 사람이 책을 고르는 거, 식당을 고르는 걸 챗GPT로 갈 수 있을까 좋은 실험으로 보고 있다. 된다면 여러 가지가 바뀔 것이다. 미래를 위한 도전이라고 생각한다.

이활석=채팅이 유용할 때가 있고 않을 때가 있다. LLM을 사용하는 패턴을 보면 처음에는 대화가 되니까 사람들이 대화를 시작하는데 LLM이 가진 기술적 특징이 채팅으로만 쓸 수 있는 건 아니다. 그런 기술의 흐름은 LLM 기준으로 많이 발전하고 있기 때문에 내부적으로 연구하고 있다.

-챗GPT 이후에 독자 개발을 이어오던 회사들에 딜레마가 많다는 얘기가 있다. 자체 AI 기술로 가는 부분하고 범용 AI 기술을 쓰는 부분에 선을 어떻게 긋고 조합할 건지?

이활석=기준은 명확하다. 고객이 만족하냐, 안 하냐다. 만족을 충족시킬 방안을 찾다가 독자 기술로 가능하겠다고 하면 그걸로 하고 범용이 좋다고 하면 그걸로 할 것이다. 때로는 조합도 가능할 것이다. 하나의 AI로만 대응이 안 되는 경우도 있다. 회사는 매출을 내야 하기 때문에 고객이 어떤 문제를 풀고 싶어 하고 트렌드를 봤을 때 어떤 기술을 개발해야 고객의 문제를 풀 수 있을지 고민하고 있다. 기술을 잘 읽고 잘 대응할 수 있느냐가 회사가 살아남기 위한 요소라고 생각한다.

김성훈=우리가 그걸 해서 세계 1등을 할 수 있느냐 생각하게 된다. OCR 팀이 50명 되면 세계 1등 할 수 있다. 추천도 30명 넘어가고 있다. 이런 부분을 만드는 게 중요하다. 저희들의 전략은 우리가 가진 차별화된 모델과 범용 AI를 잘 붙여서 진입하는 것이다. 잘못되면 그 영역부터 파인튜닝해서 들어가는 방법을 구사할 것이다. AI 산업이 규모가 어느 정도 되지 않으면 세계 1등을 하기가 힘들다.

-AskUp은 외부 모델을 활용 중이다. 비용이 어느 정도인지, 서비스 기여는 어느 정도인지

권순일=충분히 감당 가능한 수준의 비용이다. 구체적 수치는 어렵다. 비용으로부터 얻을 수 있는 노하우가 가치가 있다고 생각한다.

김성훈=7:3 정도 되는 거 같다. 30%는 자체로 하고 70%는 GPT로 보내고 있다. 70%도 GPT 의존도를 점점 낮출 것이다. 파인튜닝으로 5:5까지는 해볼 생각이다.

-공식 기록으로는 확인할 수 없지만 GPT를 활용해서 한국어 프롬프트도 많이 모았을 텐데 이 DB가 제품 개발에 어떻게 활용되는지.

이활석=어떤 개인정보가 흐르는지 예측이 불가능하기 때문에 엄격히 보안 관리 중이다. 있는 그대로 들여다보는 것도 금지시켜 놨다. 분석한 내용으로 ‘AskUp Seargest’라는 제품도 고민한 것이고 기능, 플러그인 등 회사가 나갈 방향을 모색하고 있다.

-플러그인 기반의 생태계가 커지는데 시장이 어떻게 될지.

이활석=예측이 어렵다. 대안들도 국내에 출시될 것이고 다른 회사들이 어떤 꿈을 꾸는지도 봐야 할 것 같다. 변동성이 큰 시장이고 좀 혼탁하기도 하다. 플러그인이 붙는다고 해도 업스테이지에 기회가 있을 것이라고 생각한다. 개인화, 추천으로 할 게 많을 것.

권순일=그 근간은 흔들리지 않을 것이다. 갖다 쓰기 쉽게, 붙이기 쉽게 바뀌고 있는데 어떤 식으로든 협업 구조로 갈 것이다.

-다규멘트 AI 베이스 모델을 어떻게 구축하고 수집했는지?

이활석=베이스 모델은 범용 모델이다. 어떤 용도에서나 성능이 잘 나온다. 특정 분야를 만났을 땐 성능이 아쉽다. 어떻게 잘 만드냐는 다양한 케이스에 대한 데이터가 필요하다. 여러 수단을 통해 확보 중이다. 요즘엔 합성 데이터 기술이 많이 발전해서 OCR 같은 경우에는 합성 데이터가 잘 먹히는 분야 중 하나다. 합성 데이터 기술, 범용적으로 모으는 데이터를 갖고 기술을 만든다. 인력이 많이 필요하다. 웬만한 문서 데이터에서는 잘 동작하는 걸 넣어두고 고객이 데이터를 넣어서 파인튜닝을 하면 성능이 확보된다.

-네이버, 카카오와 협업 포인트가 있을지.

김성훈=스타트업은 빠른 실행력이 장점이다. 네이버, 카카오와는 필요한 부분 협업하며 빠르게 시장을 확장할 것이다.

이활석=초거대 언어모델을 하겠다는 건 아니다. 국내 빅테크는 작업을 하는 중인데 많은 케이스는 만족하겠지만 아닌 경우도 있을 것이다. 그런 경우에 파인튜닝을 제공할 협력사가 필요할 것이다. 저희가 그런 협력사 중 하나가 될 수 있겠다. 초거대 모델을 당장 하진 않고 지켜보겠다는 입장이다.

-두 개 이상 모델을 활용하는 게 가능한지?

이활석=여러 가능한 기술을 살펴보고 있다. 바드 API도 테스트하고 있고 오픈소스도 마찬가지다. 하나의 모델로 다 될 거냐 묻는다면 안 될 가능성이 크다고 생각한다. 모델 활용을 잘할 수 있는 게 기술력이라고 생각한다. 단기적으로 업스테이지는 그 방향을 바라보고 있다.

-업스테이지 캐릭터 이름과 의미가 무엇인가?

권순일=사람 사진 같은 걸 붙여놨었다. 어색하다는 평가를 받아서 아이콘, 귀여운 모습으로 바꾸자 했다. 처음엔 생성 AI에 시켰다. 그걸로 초안이 나왔고 그걸 변경시켜서 만든 게 이 캐릭터다. 아숙업, 애스크업이라고 부른다.

-왜 하이볼을 선택했는지, 확장 전략은?

권순일=협업 제안이 먼저 왔다. 하이볼이 트렌드라고 하더라. AI가 레시피를 제시하는 하이볼을 만들어보자 해서 시작했다. AI의 레시피를 가져다 썼고 디자인도 AI 기반이다. 일상생활에 많이 침투해 있다. 협업 제안이 오면 적극적으로 대응할 것이다. AI 노출 경험을 많이 하게 하는 것이 중요하다. 그 관점에서 B2C, B2B 다 열려 있다.

-장기적인 목표가 무엇인가?

김성훈=해방과 편리함이다. 구글을 거의 안 쓴다. AskUp 쓴다. 편리하기 때문이다. 많은 사람이 편리하게 모든 일을 할 수 있는 세상을 만들고 싶다.

천지일보는 24시간 여러분의 제보를 기다립니다.
저작권자 © 천지일보 무단전재 및 재배포 금지