지난 포스팅에서 분류에 대해서까지 살펴보았다. 이제 정보를 활용하기 위한 노력이 온톨로지에 거의 근접해 왔다. 개인적으로 메타데이터는 온톨로지의 구체화, 시맨틱 웹의 구현을 위한 가장 핵심적인 요소라고 생각한다. 한 번의 포스팅으로 메타데이터에 대해 설명하기는 어렵다(목록과 분류도 한 번의 포스팅으로 설명하기 어려운 것은 마찬가지이지만 ㅡㅡ;). 자세한 설명은 잠시 접어 두고 개괄적인 이야기를 해보자.
1. 메타데이터는 복잡하다
메타데이터는 복잡하다. 결코 단순하지 않다. 하지만 단순하게 접근해보고자 한다.
흔히들 메타데이터는 ‘데이터의 데이터(A data of the data)’라고 알려져 있다. 알려져 있다는 것은 대개 그렇게 설명된다는 의미인데, 말이 좀 모순적이라고 느껴질 수 있다. 데이터의 데이터라, 이를 테면 덩치가 큰 정보나 데이터의 작은 정보, 또는 데이터라는 말이다. 덩치가 큰 정보나 데이터, 그러니까 인사과에서의 ‘직원 명부’가 그것이 될 수 있겠다. 직원 명부에는 그 회사의 임직원에 대한 목록이라 할 수 있다. 이 명부 내의 임직원들 각각은 정보, 데이터이다. 이 명부는 제법 잘 만들어져서 임직원에 대한 많은 정보들을 기록하고 있다고 하자. 그렇다면 이 임직원, 즉 정보는 사번, 부서 등과 같이 임직원과 관련된 작은 정보들을 또 갖고 있는 것이다. 이 작은 정보들, 이 정보들이 데이터의 데이터, 정보의 정보, 즉 메타데이터가 되는 것이다.
설명해 놓고 보니 쉽다. 뭐 하나도 안 복잡하구만. 하지만 자세히 보면 메타데이터는 단순히 작은 데이터로 끝나지 않는다는 것을 알 수 있다. 메타데이터의 핵심은 그 목적에 있다. 위의 예에서 메타데이터는 정보를 관리하기 위한 정보이다. 즉, 관리를 그 목적으로 하고 있는 것이다. 또한 메타데이터는 많은 데이터에 대한 각각의 정보를 일정한 범주로 나누어 기록하고 있다는 것을 알 수 있다. 즉, 목록에 대해 분류된 정보를 기록하고 있는 것이다.
설명의 편의를 위해 <그림 1>과 같이 개념을 풀어 놓았지만, 사실 메타데이터는 구조를 갖고 있다. 각각의 정보를 범주화한 것을 메타데이터 요소라고 한다. <그림 1>에서 이름, 사번 따위의 정보를 범주화한 것이 요소이고 그것을 사람들이 이해할 수 있도록 이름 붙인 것이 요소명이다. 이러한 요소에 어떠한 내용을 어떻게 넣어야 하는지에 대해 설명하는 것이 메타데이터 스킴이다. 메타데이터는 확실히 복잡하다.
2. 메타데이터는 왜 만드나?
메타데이터는 덩치가 큰 데이터를 설명하는 역할을 한다. <그림 1>에서 ‘김말자’에 대한 정보들, 즉 부서나 사내번호 등과 같은 정보들은 회사 내에서의 김말자씨에 대한 설명이다. 어느 부서에서 일하며 몇 번으로 전화해야 통화가 가능한지 설명해주고 있는 것이다.
메타데이터는 목적에 따라 일반적으로 기술적(Description), 관리적(Administration), 구조적(Structure) 메타데이터로 나누고 있다. 이렇게 나누어진 메타데이터의 역할은 다음과 같이 간략하게 설명할 수 있다.
-
기술적 메타데이터는 데이터의 내용에 대한 정보를 설명함으로써 다른 자료와 구별하고 효과적으로 찾을 수 있도록 도와준다.
-
관리적 메타데이터는 데이터와 관련된 부가적인 정보들을 알려줌으로써 잘 정리하고, 이용하고, 활용할 수 있도록 도와준다.
-
구조적 메타데이터는 데이터의 논리적인 구성에 대한 정보들을 기록하여 기계적으로 처리가 가능하도록 도와준다.
메타데이터의 궁극적인 목적은 기계, 즉 컴퓨터가 데이터를 보다 쉽게 찾도록 도와주는 것이다. 이를 위해서 잘 정리하고(조직하고), 잘 설명하기 위한 정보들을 체계적으로 나누고 기록하는 것이다.
3. 메타데이터는 어떻게 만드나?
메타데이터는 다양한 방법으로 만들 수 있겠지만 크게(아주 크게) 두 가지 방법으로 만들 수 있다. 첫 번째는 필요한 정보를 분류하여 범주화하는 방법이 되겠다. 데이터를 모으는 목적과 활용하는 목적에 따라 정보를 체계적으로 정리하는 것이다. 두 번째 방법은 이미 개발된 메타데이터를 그대로 사용하거나 필요한 범주를 활용하는 방법이다.
첫 번째 방법은 좀 더 쉽게 말해, 메타데이터를 새로 만드는 것이라고 할 수 있다. 완전히 새로 만들 수도 있겠고 만들어진 메타데이터의 요소들을 참고해서 필요에 맞게 만들 수도 있다. 국제표준기구인 ISO에서는 ISO/IEC 11179라는 이름의 메타데이터 작성 지침서를 제공하고 있다. 이러한 지침서는 다른 사람들이나 기관과 함께 사용하고자 할 때, 즉 상호호환성을 갖춘 메타데이터를 만들고자 할 때 좋은 안내가 된다. 이 방법은 메타데이터를 새로 만들어야 한다는 점과 작성된 메타데이터의 공유가 어렵다는 단점이 있지만 목적에 최적화되어 효율적으로 활용할 수 있다는 장점이 있다.
두 번째 방법은 전문적으로 많이 활용되고 있으며 공유를 고려한 방법으로 이미 널리 사용되고 있는 메타데이터를 활용하여 상호호환성을 기본적으로 갖추어 데이터에 대한 정보를 생성하는 방법이다. 이 방법은 목적에 꼭 맞지 않을 수 있어 비효율적일 수도 있다는 단점이 있지만 활용이 쉽고 간편하다는 장점이 있다.
앞서 설명한 메타데이터를 만드는 두 가지 방법은 정말이지 큰 관점에서 나눈 것이다. 많은 연구를 통해 메타데이터를 만드는 다양한 방법들이 개발되었다. 다음 포스팅들을 통해 차차 알아보도록 하겠다.
4. 온톨로지와는 무슨 상관이지?
개인적으로, 정말 개인적으로 메타데이터는 온톨로지 구현을 위한 바탕이 된다고 생각한다. 기계가 정보를 이해하기 위해서는 개념을 정의하고 그 관계를 정의하는 것만으로는 부족하다. 정의된 개념에 대한 실제 정보가 필요하다. 정보가 포함하고 있는 내용이 어떤 개념에 속하는지, 정보가 의미하는 것은 어떤 개념에 해당하는지 메타데이터가 있다면 보다 손쉽게 알 수 있을 것이다.
온톨로지가 개념 간의 관계를 통해 의미적인 정보를 찾아내는 바탕을 만들어 주는 것이라면 메타데이터는 정보의 숨은 의미를 설명하여 온톨로지 환경에서 정확한 정보를 찾아낼 수 있는 실마리와 단서를 제공할 수 있는 바탕을 만들어 주는 것이라 할 수 있겠다.
다음 포스팅에서는 정확한 정보를 확실하게 구별하고 찾아갈 수 있는 식별자에 대해 알아보도록 하겠다.
'ontoBox' 카테고리의 다른 글
| 온톨로지, 그 가능성에 대하여: Intro (1) | 2010/03/10 |
|---|---|
| 정보 그리고 온톨로지 : 식별자에 대하여 (0) | 2010/02/14 |
| 정보 그리고 온톨로지 : 메타데이터에 대하여 (0) | 2010/02/13 |
| 정보 그리고 온톨로지 : 분류에 대하여 (0) | 2009/12/07 |
| 정보 그리고 온톨로지 : 목록에 대하여 (0) | 2009/11/22 |
| 정보 그리고 온톨로지 : 온톨로지의 밑바닥에 대하여 (2) | 2009/07/01 |