[일문일답] “내일 날씨 어때?” SKT 음성 인공지능 ‘누구’가 응답한다

[천지일보=박수란 기자] SK텔레콤이 음성인식 기반 인공지능 서비스 ‘누구’를 공개하며 ‘AI(인공지능) 대중화 시대’ 개막을 선언했다.

SK텔레콤은 31일 서울 을지로 본사 사옥에서 열린 기자간담회에서 ‘누구’를 선보였다.

인공지능 스피커인 ‘누구’는 사용자가 “신나는 음악을 틀어줘”라고 말하면 음악을 자동으로 선곡 재생해주며 “야구장에 갈 건데 내일 날씨 어때”라고 물으면 해당 지역의 날씨 정보를 음성으로 안내하는 방식이다.

‘누구’는 사용자가 원하는 바를 파악한 후 음악 스트리밍 서비스·스마트홈 등과 연동돼 ▲조명, 제습기, 플러그, TV 등 가전기기 제어 ▲음악 추천 및 자동 재생 ▲날씨, 일정 등 정보 안내 ▲스마트폰 위치 찾기 등 다양한 정보와 편의를 제공한다.

다음은 SK텔레콤 박일환 디바이스지원단 단장, 박명순 미래기술원 원장, 김성한 디바이스기획본부 본부장과의 질의응답.

- 자체 통신 기능인가
자체 와이파이 기능을 갖고 있다. 독자적으로 통신을 할 수 있다. 처음에 누구를 동작하기 위해서 스마트폰 앱을 통해 여러 서비스에 접촉하는 일들을 진행하고 그 이후엔 독자적으로 동작한다. 이 디바이스로 인해 추가 요금을 내야 하는 일은 없다.(박일환)

- SK C&C도 IBM 왓슨과 협력하고 있는데 SK텔레콤이 독자적으로 개발한 것인가
인공지능 분야는 여러 가지다. 왓슨의 방향은 B2B 분야일 것 같고 왓슨은 전문가 영역에 훨씬 특화돼 있다. SKT 인공지능은 B2C로 일반적인 기능에 초점이 맞춰져 있다. C&C와 따로 움직이는 것처럼 보이지만 시간이 가면서 협력할 수 있을 것 같다.

- 목소리는 누구인가
목소리는 개인정보보호로 실명을 밝힐 수 없다. 다양한 성우 목소리를 여러 기술력과 관점에서 테스트해 감성적인 목소리를 갖고 있는 성우 목소리를 채택했다.(김성한)

- 이름은 자신이 선택해 부를 수 있나
기술적 부분 고려해 4가지 이름, 팅커벨, 크리스탈, 아리아, 레베카이다. 향후 다양한 이름을 적용하기 위해 상당한 학습이 필요하고 일정 학습 기간이 지나면 고객이 원하는 이름을 부를 수 있도록 최대한 빠른 시간 안에 구현할 수 있도록 하겠다.

- 멜론 서비스는 유료인데 어떻게 사용할 수 있나
당분간 멜론 서비스는 3개월 무료로 제공할 것이다. 이후에는 멜론 서비스 가입하면 누구 서비스와 연동해서 동시에 사용할 수 있다.(박일환)

- 앱 연동 방법은
누구 앱을 통해 T 아이디로 가입하고 멜론, 스마트홈 연동을 할 수 있도록 서비스했다.

- 인식 데이터 수집은 어떻게?
자연어 처리를 2011년부터 시작했다. 누구 서비스 준비 이전에 자연어 처리 데이터 베이스는 많이 구축돼 있었다. 서비스 출시하면서 음악과 관련한 도메인에 집중했고 그 외에 나머지 일반적인 것들은 이전부터 쌓아왔던 것이다. 누구 출시를 통해 받아들이는 데이터가 훨씬 더 현실적이된다. 내일부터 출시하면 고객이 사용하는 패턴을 분석해서 데이터 수집을 계속 구축할 계획이다.(박명순)

-디스플레이 적용 여부는
음성인터페이스에 디스플레이로 보여주는 것은 혼란을 주는 것 같고 음성 인터페이스의 가능성에 대해 시도하고 싶은 의도가 있었다.
음성 UX는 큐레이션 등 고객에 최상의 답변을 제공하는 것이다. 사업 초기에는 디스플레이를 붙이지 않았고 다양한 로드맵을 갖고 있다. 다양한 서비스를 확장할 것인데 이 서비스에 최적화된 단말을 어떻게 할 것인지는 고민하고 확대할 것이다. 음성인식이 탑재된 웨어러블 형태 등 (김성한)

- 에코 등 글로벌 기업 경쟁과는 어떻게
인공지능 사업 분야가 넓다. 각각 사업자들이 다양한 방법으로 인공지능 서비스를 준비하고 있다.
기술력은 음성인식, 영상인식, 자연어 처리 부분은 국내 최초로 장기간 투자해서 상당 부분 높여왔다고 자평한다.
하드웨어 측면은 기존의 아마존 에코가 서비스를 출시했는데 제품과 비교해보면 누구 디바이스는 디자인 감성적인 포인트를 강조했다. 외부 무드등 기능을 채택해 고객과 감성적인 형태의 디자인을 강조했다. 멜론 서비스는 음질 측면에서 아이리버 전문가들이 튜닝 작업에 참여했고 음질 측면에서 아마존 에코 대비 높은 평가를 받았다.
서비스 관점은 SKT가 자체 보유하고 있는 T맵, Btv 서비스 등 초기 음성인식 기능과 연계해 서비스 강점을 갖고 있다. 개방형 지향하고 있어 다양한 사업자들과 계속적으로 서비스를 업데이트해 경쟁 우위를 갖겠다.(김성한)

- 답변이 클라우드에서 이뤄지는가
클라우드상에서 일어나는 것이고 스마트폰이 관여하지 않으며 처음에만 커넥션이 필요한 부분에서 스마트폰을 통해 이뤄진다.

- 개발 관련 파트너사는
음성인식, 영상, 언어처리 엔진은 SKT의 자체 기술이다. 디바이스는 파트너사와 튜닝은 아이리버사에서 했고 전체 시스템 앱을 만든 것은 파트너와 개발했다.(박명순)

- 음성인식은 어떤 과정인가, 개인정보보호 우려는
지금은 개인별로 식별을 하지 않는다. 누가 불러도 다 사용할 수 있는데 이후에는 음성으로 인증하는 기술을 도입해 내년 정도는 음성을 인증하는 기술 적용할 것

- 물건 주문 시 결제는
음성 인증하는 것이 중요한데 주문에 대한 확인만 정확하게 한다. 향후 페이 등과 음성을 통해 인증하는 과정이 들어가면 좀더 고민을 많이 해야 한다. 음성 데이터는 학습 용도로 데이터 보관을 하고 있고 개인정보와 관련된 것은 활용하고 있지 않다.

- 와이파이 간섭이 있을 것 같은데
딜레이 현상을 나타나는데 와이파이를 쓰는 특성이긴 하다. 전송하는 데이터량이 얼마 안되기 때문에 와이파이 영향도는 미미하다. 딜레이, 유실 현상은 와이파이를 쓰기 때문에 나타나는 현상은 있다.

- 추후 남성 음성 지원이 되나
성우 목소리와 합성하는 것을 하고 있는데 합성 기술은 딥러닝 기술을 활용하고 있다. 보이스에 보면 페르소나 인격을 형성하고 있는데 성우 목소리는 20대 중후반의 비서에 이성적인 보이스톤을 기획했다. 향후에는 합성기술 발달하면 남성, 아이 목소리 등으로 확장할 계획이다. 당분간은 여성 성우와 이 성우 목소리를 합성한 것으로 서비스한다.

- 다국어 지원 계획은
현재는 한국어 중심으로 돼 있고 다국어 처리는 굉장히 많은 인력이 필요하다. 영어라든지 하려면 영어 처리하는 파트너사와 협력하는 것이 빠를 것이다.

천지일보는 24시간 여러분의 제보를 기다립니다.

박수란 기자 union@newscj.com 다른 기사 보기

개의 댓글

BEST댓글

BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.