ontoBox2009/12/07 22:25

저번 포스팅에서는 다음 포스팅의 주제로 마치 메타데이터에 대해  쓸 것처럼 마무리 되었으나(사실 그럴 생각이었으나) 그전에 분류에 대해 알아보고 넘어가는 것이 좋을 것 같다. 이전 포스팅에서 아주 간략하게 분류에 대한 내용을 다루었지만 어쩐지, 궁금하면 그냥 보쇼, 라는 건방진 느낌이라 다시 한번 다뤄보고자 한다.


1. 분류도 단순한가?

목록은 단순하다고 지난 포스팅에서 줄기차게 이야기 해 대었다. 분류도 단순한가? 어쩐지 뜬금 없는 이야기지만, 요즘 세상사는 참으로 단순하다는 것을 느낀다. 배고프니까 밥을 먹는다. 밥 사먹으려고 돈을 번다. 돈을 벌려니 일을 한다. 일을 하니 배고프다. 배고프니까 밥을 먹는다. 참으로 단순한 라이프 사이클이 아닌가. 분류도 그렇다. 많으니까 나눈다. 나누려니까 공통점을 찾는다. 공통점으로 한데 모으니 많다. 많으니까 나눈다. 단순하다.
그런데 왜 다들 세상살이가 어렵다고 할까? 밥을 뭘 먹을까 고민하고, 어떻게 하면 돈을 많이 벌까 고민하고, 일을 어떻게 쉽게 할까 고민하고. 이렇게 고민하고 저렇게 고민하니 어렵기도 할 테다. 분류도 그렇다. 어떻게 나눌까 고민하고, 많은 것을 잘 나누려고 고민하고, 어떤 것에서 공통점을 찾을까 고민하고. 이렇게 고민하고 저렇게 고민하다 보면 분류도 어려워진다.

다양한 분야에서 분류가 사용되고 있다. 우리 주변에서 가장 쉽게 찾아 볼 수 있는 분류는 포털 사이트의 디렉토리 서비스가 될 것 같다.

그림1 네이버의 디렉토리 서비스

<그림1>은 네이버의 인물, 사람들 카테고리 안의 홈페이지들 인데 홈페이지를 직업에 따라 나누고 있는 것이 보인다. 개인 홈페이지는 가족, 부부, 외국인 등 홈페이지가 나타내는 특성에 따라 나누고 있는 것으로 볼 수 있겠다. 쉽지 않은가! 분류는 쉽다.

2. 분류는 정말 단순한가?

분류가 단순하고 쉽기는 하지만, 온톨로지의 영역으로 가고자 한다면 역시 조금은 어려워진다. 예컨대 어디까지 나누고 묶을 수 있는가의 문제이다. 조금 어렵게 느껴지는데, 세상의 지식을 전부 일정한 규칙에 따라 나눌 수 있는가, 라는 질문이라면 좀 더 확실할까?

많은 분야에서 분류가 연구되고 있고 활용되고 있다. 중학교 때쯤인 것으로 기억하는데, 생물 시간에 종, 목, 강 따위로 지구상의 생명체를 나누는 것을 공부한 적이 있었다. 생물분류는 자연적 분류라 할 수 있다. 자연적 분류란 나누려는 대상이 원래 가지고 있는 특성을 나눔의 기준으로 삼는 것을 의미한다. 사람을 나눌 때 어린이, 어른으로 나눈다거나 남자, 여자로 나눈다거나 하는 것이다. <그림 1>에서의 분류는 자연적이라 할 수 없다. 가족, 부부, 건축가는 자연적인 것이 아니다. 인간이 사회를 구성하고 영위하며 발생된 인위적인 것이다. 이러한 기준, 즉 인위적으로 발생한 특성에 따라 나누는 것을 인위적 분류라 할 수 있다. 자연적 분류는 객관적 성질을 기준으로 분류하는 것이고, 인위적 분류는 유사성에 따라 분류하는 것이라 할 수 있다.

그렇다면 이 세상의 모든 지식을(우리는 온톨로지, 즉 정보에 대해서 이야기하고 있으니까) 자연적, 인위적 분류를 통해 나눌 수 있을까? 라는 질문에 봉착하게 된다. 결론을 이야기 하자면 “가능하지만 불가능하다” 이다.
가능하다는 측면에서 이야기 해보자. 가능하다. 왜 안돼? 된다. 세상의 지식은 철학, 문학, 종교 등의 커다란 범위에서 그 공통점이 있다. 철학에 대해 이야기하는 책, 문학 작품으로 나눌 수 있다. 또 문화, 생활, 경제 등으로 나눌 수 있다. 커다란 범위에서 묶인 지식들은 또 다시 나뉠 수 있다. 문화에서는 영화, 음악, 연극 등으로 나눌 수 있고 영화는  예술영화, 오락영화, 가족영화 등으로 나눌 수 있다. 예술영화도 장르, 감독, 국가 등으로 나눌 수 있다. 큰 범위는 자연적 분류, 즉 문화라는 객관적 성질(객관적 성질이라 하기엔 다소 무리가 있는 듯 하지만 ㅡㅡ;)을 기준으로 나눈 것이고 작은 범위는 인위적 분류, 즉 같은 국가라는 유사성을 기준으로 나눈 것이다. 잘 나눠진다.
불가능하다는 측면에서 이야기 해보자. 생활과 경제는 따로 떼어 놓을 수 있을까? 종교와 문학, 종교와 철학은 따로 떼어 놓을 수 있을까? 물론 기준을 만드는 관점에 따라서 다를 수 있겠지만 지식은 단 하나의 분야로 정의하기 어렵다. 다양한 지식이 융화되어 또 다른 지식으로 발전하는 것이 더 급속하게 진행되고 있는 요즘에는 더더욱 그렇다. 분류라는 것이 어려워지기 시작한다.

3. 세상의 지식을 나누기는 정말 어려운가?

온톨로지는 개념의 명세화라는 정의를 기억하고 계시는가? 온톨로지의 궁극적인 목표는 생각하는 컴퓨터이다. 정보에 의미를 부여하고 관계를 맺어주어 컴퓨터가 이해할 수 있는 정보를 통해 컴퓨터가 자동적으로 지식을 제공할 수 있도록 하는 것이 온톨로지의 목표라 생각한다. 그러자면 이 세상의 지식을 명확하게 나누어 주어야 한다. 아주 이상적으로는 그렇다. 하지만 앞서 말했듯이 자연적 기준과 인위적 기준으로 세상의 모든 지식을 똑 부러지게 나누기는 어렵다. 어려우니까 관둘까… 아니다 포기하기는 이르다. 어려우면 어려운 대로 다른 방법을 찾을 수 있을 것이다.

분류는 Classification과 Taxonomy로 나눌 수 있겠다. 형식적으로는 큰 차이가 없지만 그 방법에는 조금 차이가 있다. Classification은 유사성을 기준으로 한다면 Taxonomy는 객관적 성질을 기준으로 한다. 그렇다 인위적 분류와 자연적 분류의 차이이다! 앞에서 가능하다는 측면에서 이야기한 것처럼 큰 범위는 자연적 분류로, 작은 범위는 인위적 분류로 나누는 것도 한 방법이 되겠다. 즉, Taxonomy를 통해 큰 틀을 잡고 세세한 것은 Classification을 통해 채워 나가는 것이다.
하지만, 문제는 여전히 존재한다. 두 가지 이상의 지식이 포함된 것은 어떻게 나눌 것인가! 필자의 지식이 부족한 탓인지 아직 이에 대해 무릎이 탁! 쳐지는 명쾌한 방법은 알지 못하고 있다. 문헌정보학 분야에서 분석합성식 분류법이라 방법을 통해 시도가 되었지만 그 방법이 난해하여 잘 활용되지 못하고 있다.

이 부분에 대해서는 추후 시맨틱 관점에서 다루어 보고자 한다.o

4. 분류와 온톨로지는?

온톨로지의 기반, 기반이라 하기엔 무리가 있으려나…, 개념의 명세화를 위해서는 분류를 이해하고 개념들을 정의하는 것이 필요하다. 클래스 단위의 용어들을 정의하고 그들의 관계를 정의하기 위해서 분류는 매우 중요하다고 할 수 있다. 상위 클래스와 하위 클래스를 정의하는 것은 Taxonomy를 통한 정의가 필요하다. 때로는, 분야에 따라서는 유사성에 따른 분류가 필요할 수도 있다. 무엇보다도, 이후 다루게 될 메타데이터에서 요소를 도출하고 정의하기 위한 기본으로써 분류는 매우 중요하다.
온톨로지를 잘 만들기 위해서는 그 바탕을 잘 닦는 것이 중요하다. 이를테면 설계에서의 모델링의 과정이라 할 텐데, 그 모델링의 기초가 되는 것이 분류가 아닐까 조심스럽게 이야기 해본다.

이번 포스팅은 참으로 부족한 점이 많다. 쉽게 풀어 쓰자니 아는 것이 많아야 하는데 전문 분야가 아니라 ㅎ 아… 미련한 핑계 ^^;

Posted by readholic