김홍철 한국기술금융진흥협회 IT 전문위원

 

인터넷 사용자들이 원하는 정보를 얻기 위해서는 구글, 다음, 네이버와 같은 인터넷 검색 포털을 이용해야 한다. 관문을 뜻하는 포털(Portal)을 통해 본 관문을 통과해야 비로소 필요한 지점에 도달할 수 있게 된다는 의미이다. 그리고 포털에는 정보를 저장하고 있는 수십억개의 사이트가 존재하며, 이용자들은 원하는 정보를 얻기 위해서는 해당 사이트가 가지고 있는 정보를 추출해내고자 검색어를 입력한다.

포털들은 고유의 검색엔진을 구동해 검색어를 파악하고, 로봇(Robot)이라는 프로그램을 이용해서 전 세계의 웹사이트 정보를 수집하고, 이용자가 원하는 정보를 끌어오게 된다. 이렇듯 정보 추출 및 전달을 위해서는 고도의 탐색기술이 적용돼야 하는데 기존의 웹기술은 수십억개의 사이트에 축적된 방대한 데이터에 대한 키워드(key-word)에 의해서만 정보접근을 허용하고 있어, 정보검색 시 무수히 많은 불필요한 정보가 돌출돼 트래픽이 폭주되는 현상이 발생되고 있다.

사용자가 모든 정보를 해석, 추출하는 방식으로는 신속한 정보 전달은 물론, 인터넷 공용망의 효율적 사용을 위해서도 부적절한 이 같은 상황은 컴퓨터가 필요한 정보를 추출, 해석, 가공할 수 있는 방법이 없기 때문으로, 이를 극복하기 위한 대안으로 제시된 것이 시맨틱웹 기술이다.

시맨틱웹은 기존 웹을 확장해 컴퓨터가 잘 이해할 수 있는 의미를 기반으로 의미적 상호운용성(semantic inter-operability)을 실현해, 다양한 정보자원의 처리 자동화, 데이터의 통합 및 재사용 등을 컴퓨터가 스스로 수행토록 하여, 인간과 컴퓨터 간의 효과적인 협력체계를 구축하기 위한 것이다. 즉 컴퓨터가 웹에 존재하는 정보자원의 의미를 이해하고, 정보의 검색, 추출, 해석, 가공 등 제반 처리를, 사용자를 대신해 지능형 에이전트로서의 역할을 수행토록 하게 하는 컴퓨터 중심의 기술로 보면 될 것이다. URL이라 불리는 대부분의 인터넷 주소창에 처음 입력되는 www(월드와이드웹)의 창시자인 팀버너스리는 자신이 고안한 인터넷 세상을 궁극적으로 이루기 위해서는, 자원을 표현하는 데 한계를 가진 기존 웹 방식으로는 불가하다고 판단했으며, 인터넷이나 웹상에 존재하는 모든 데이터에 의미를 부여해 그 의미들을 컴퓨터가 이해할 수 있는 지능화된 웹을 만들고, 사람이 관여하지 않아도 컴퓨터가 신속하게 자동으로 처리할 수 있는 지능화된 웹을 만들 것을 제안해 이들 기술이 탑재된 시맨틱웹 기술을 만들었던 것이다. 

우리 주변의 IT환경은 데이터에서 정보(information)로, 그리고 지식(knowledge)으로 진화, 발전하고 있다. 컴퓨터 또한 특수 분야 종사자들만 사용하던 거대 메인프레임 컴퓨터에서 개인용 PC를 거쳐 Handheld형의 노트북, 패드로 사용 방식이 변화됐으며, 최근에는 와이파이를 이용한 유비쿼터스 환경이 대세로 굳혀지고 있다. 이에 맞추어 언어로서만의 표현인 구문적인(Syntactic)방식을 넘어 의미론적(Semantic) 세상으로 변화하고 있으며, 시맨틱웹 기술은 이러한 추세를 감안한 효과적 커뮤니케이션 방법으로도 해석될 수 있다.

시맨틱웹의 사용 예를 간단히 설명하자면, 기존의 웹에서는 ‘사과’란 단어와 ‘빨간색’이란 단어는 별도로 표현되어 ‘사과는 빨갛다’라는 자연어적 문장을 이해하지 못한 채 ‘사과’와 ‘빨간색’이란 별개의 단순 문자열을 보고 해석해 정보를 전달한다. ‘사과’와 ‘빨갛다’라는 것이 기계어로는 연결이 되지 않으므로 두 가지 용어로 검색이 돼야만 비로소 ‘사과는 빨갛다’라는 원하는 결과를 얻게 된다. 그러나 시맨틱웹에서는 이 같은 표현방식을 <‘사과’ ‘색’ ‘빨간’>이라는 확장 개념으로 표현해 컴퓨터가 이를 해석할 때 ‘사과의 색은 빨갛다’라는 의미로 해석하고 처리할 수 있게끔 하는 것이다. 우리나라에서는 2012년부터 시청, 구청 등 지방자치단체의 민원 홈페이지를 비롯해 국립중앙도서관, 국토지리정보원 등 각종 공공기관에서 시맨틱 검색시스템을 도입, 민원사항에 대한 신속한 대응을 위해 사용하고 있다. 시맨틱웹기술을 모태로 한 인공지능형 검색엔진의 탄생이 멀지 않아 보인다.

천지일보는 24시간 여러분의 제보를 기다립니다.
저작권자 © 천지일보 무단전재 및 재배포 금지