보이지 않는 웹

!@#… 웹이라는 녀석은, 원래는 www 표준규약과 html 언어에 의하여 움직이도록 되어있다. 그냥 어떤 기술자가 짜잔~하고 시장에 내놓은 것이 아니라, 여러가지 합의에 의해서 표준안으로 움직인다는 것이다(대부분의 현대 테크놀로지가 그렇듯이).

…당근, 표준이라는 것은 약속이라는 말이고, 대개 약속은 어겨지기 마련이다. 표준안은 보통 너무 피상적이고 미약하며, 재빠른 기술의 발전에 대응하지 못하고 굼뜨다. 새로 표준을 만드는 것은 엄청난 의결 과정을 거쳐야 하는 방해물. 말이 이해가 안가면, 대략 이 나라의 ‘국회’를 생각해보면 된다. 아니면, 지금 다니고 있는 회사, 혹은 기타 자신이 속해있는 임의의 개판 일보직전의 조직을 한번 상기해보자.

…여하튼 그래서, 비록 표준안에 속하지는 않지만 나름대로 자신들의 재주를 발휘한다고 하는 것들이 등장하기 마련이다. 표준안의 호환성을 지키면서 부가기능을 첨가하는 정도면 좋은데, 종종 꽤 근본적인 부분까지도 건드리는 만행이 이어지기 마련이다. 그리고 많은 경우, 그 새로운 기술적 성과를 새로운 공공 표준안으로서 추진하고 공개하기보다는 그냥 사익을 위해서 활용해버린다. 사실 이들은 표준안의 어기는 것으로서, 호환성 문제라든지 하는 것을 통해서 전체 시스템의 비효율화로 이어지든지, 아니면 MS처럼 미디어 공공재의 사유화라는 무시무시한 무공으로 세계를 혼란스럽게 만들 수도 있다(왜 어떤 페이지들은 ‘MS 인터넷 익스플로러’에서만 돌아가는지 고민해본 적 있는가?).

…더헉. 또 무거운 글이 되는군. 여튼 원래 하려던 말로 돌아가자. 속칭 “보이지 않는 웹”이라는 개념이 있다. 스타워즈 에피소드1 이 아니라, 우리 일상적인 인터넷 생활의 가장 현실적이고도 피부에 와닿는 개념이다. 무엇인고 하니, html을 기반으로 하는 표준적인 웹 검색엔진 시스템으로는 찾아낼 수 없는 인터넷 상의 정보들을 지칭하는 것이다. 검색엔진에 걸리지 않는다는 것은, 다른 정보를 통해서 물어물어 연결되어 찾지 않고서는 그 정보의 존재 자체도 모르게 된다는 말이다. 매초 매분마다 새로운 정보가 탄생하는 정보의 무한쓰레기통인 인터넷에서, 그건 꽤 치명적이다(라이코스에서 최초의 검색엔진을 발명하기 전의 구석기급 웹이 얼추 그런 모양새였다).

…이런 식이다. 더 많은 정보를 효율적으로 관리하겠다고, 사람들은 독자적인 데이터베이스 엔진을 만들어냈다. SQL이니 뭐니 하는 어차피 들어봤자 머리만 아픈 이름들이 여기에 해당된다. 그런데, 웹에서 구현을 하려면 html이라는 표준언어를 사용한 ‘웹페이지’라는 물건으로 그 정보를 변환시켜줘야 한다. 안그러면 창에 안뜨니까. 그래서 jsp니 asp니 php니, 좀 더 간단히는 cgi니 하는 것들이 마구 등장한다(이 이름들은 주소창에서 심심치 않게 본 기억이 있을 것이다). 즉 특정한 데이터를 임시적으로 html로 만들어서 당신들의 브라우저에 쏴주는 것이다. 실제로 그 데이터에 대한 그 모양 그대로의 html언어로 된 웹페이지 파일 자체 – 즉 물리적(?) 실체는 존재하지 않는다! 가상-가상현실의 경지다, 이정도쯤 되고 보면.

…하지만 여기서 문제 발생. 실체(html 파일)가 없다보니, 그것을 웹 검색엔진은 검색해내지 못한다. 비록 대부분의 검색엔진은 웹크롤러라는 소프트웨어 로보트를 활용해서 인터넷 곳곳을 누비며 정보를 수집하도록 하고 있기는 하지만, 그런 데이터베이스형 정보창고 앞에는 무용지물이다. “모든 가능한 독창적인 데이터베이스 엔진”에 대해서, “모든 가능한 정보 입력”을 다해보고, 그 결과 나오는 모든 가상의 html 페이지들을 등록해 놓기에는 턱없이 역부족인 것이다. 데이터베이스라고 자꾸 말하니까 못알아들으시는 분들도 있을지 모르겠지만, 그냥 게시판이라고 부르면 어떨까? 한국의 웹 상에 퍼져있는 수많은 게시판의 정보들은 거의 대부분 일반적인 웹 검색엔진으로 검색되지 않는다. 가장 많이 쓰이고 있는 게시판 프로그램인 제로보드나 이지보드 등이, 실제로 html을 남기는 것이 아닌 독자적인 엔진으로 돌아가기 때문이다. 해당 게시판 내부에서 게시물 검색하는 것이야 물론 깔끔명쾌하지만. 그렇기 때문에 그런 게시판에 차곡차곡 쌓여있는 수많은 주옥같은 정보들은, 대부분 “보이지 않는 웹”이 되어버린다. 내부로 들어오지 않고서는 검색이 안되는, 그래서 인터넷의 가장 큰 장점을 스스로 포기하는 그런 데이터가 된다는 것이다. 주소창 속의 것은 자고로 *.html로 끝나야 한다. 무슨 “…do?Redirect…20394#” 따위가 아니라.

…Movable Type로 대표되는 최근의 여러 블로그 엔진들은 그런 점에서 상당히 흥미롭다. 기존의 게시판들 마냥 자유롭게 작성하고 고칠 수 있으면서도, 실제로 html을 만들어서 저장해놓는다. 포털 서비스에서 해주는 맞춤형 블로그 중에서 생각하자면, 야후!블로그가 대표적일 것이다. 그런데, 예를 들자면 엠파스나 네이버 블로그는 그런 해피한 녀석들이 아니다. 그냥 자체 엔진으로 돌아가는 것으로, 엄밀하게 말하자면 기존의 게시판들과 큰 차이가 없다. 좀 더 사용하기가 편해졌다는 것만 제외하자면 말이다. 한마디로, “보이지 않는 웹”이라는 사실에는 전혀 변함이 없다는 것이다! 굳이 말하자면, 네이버 블로그의 자료 검색은 네이버 검색엔진에서나 돌아간다. 어디 외부 페이지에서 직접 링크를 한 게시물이 있어서, 그것을 타고 검색엔진의 로봇이 어느날밤 우연히 흘러들어와 기록을 남기고 가는 경우는 예외지만 말이다. 그런 치명적인 약점들을 감추기 위해서 이웃이 어쩌느니 일촌이 어쩌느니 하는 오만가지 꼼수를 쓴다.

!@#…인터넷은 네트워크다. 그 중에서도, 가장 개방되고 가장 호환성있는 궁극의 네트워크를 지향하고 만들어졌다. “보이지 않는 웹”은 그 이상향이 실제로는 얼마나 멀리 있는지를 증명해주는 하나의 사례다. 사실은 별 쓸모도 없는 약간의 편의, 약간의 허영 때문에 네트워킹, 사람과 사람들의 진정한 폭넓은 커뮤니케이션이라는 목표로부터 하염없이 벗어나는 나약함이 싫다. 무엇보다, 그것을 알면서도 마찬가지로 그것에 의존할 수 밖에 없는 미미한 기술적 숙련도만을 가지고 있는 나 자신도 부끄럽기 짝이 없다. 여기 네이버에 블로그질을 하고 있는 것이라든지 말이다. 정말로 열린 소통을 지향하는 네트워크, 그것을 목표로 하는 인터넷이 되었으면 좋겠다(그런데, 과연 나말고 다른 사람들도 그것을 원하기는 할까?).

 

—- Copyleft 2004 by capcold. 이동자유/동의없는개작불허/영리불허 —-

Comments are closed.