공간정보/표준

데이터, 표준, 제품사양서

하늘이푸른오늘 2018. 1. 10. 15:24

공간정보 데이터를 만들 때 가장 중요한 것이 표준입니다. 공간 데이터의 표준을 지키는 것은 전체 표준에서 90% 이상을 차지한다고 생각합니다. 예전에 국가 등의 기관에서 보유한 데이터중 80%는 공간과 관계있다라는 말이 있었고, 이제는 우리나라도 많은 공간 정보들이 공개되고 있지만, 아직까지는 표준을 지킨다거나, 정제된 데이터라고 말하기는 힘든 것 같습니다.


정제된 데이터란, 언제 어디서 누구 제작했더라도 동일한 구조와 품질로 생산된 데이터를 말합니다. 같은 기관에서 작성한 데이터가 어떤 회사에서 제작했는지, 누가 검수를 했는지에 따라 달라지고, 매년 담당자가 달라질 때마다 내용과 구조가 조금씩 변한다면, 공간정보의 활용성은 떨어질 수 밖에 없습니다.


또 다른 측면에서 정제된 데이터라는 것은 컴퓨터가 이해할 수 있는 데이터라고 할 수 있습니다. 사람이 데이터의 구조와 내용과 의미를 조사해서 편집을 해야 사용할 수 있다거나, 매번 어떤 과정을 거쳐야만 변환할 수 있어서 사람의 수작업이 개입되어야 한다면 데이터로서의 가치는 떨어지게 됩니다. 한번 설정을 해두면 투명하게 데이터가 전달되어야 합니다.


예를 들어 어떤 기관에서 새롭게 데이터를 갱신하면, 누구의 손을 거치지 않더라도 중간생산자나 포털등을 거쳐 즉시 국민에게 서비스될 수 있습니다. 현재와 같이 정제가 되지 않은 데이터라면, 갱신된 지역이 어디인지, 어떤 지형지물이 갱신되었는지 찾아보고, 자신의 데이터베이스에 맞춰 수정하여 서비스가 될 때까지 몇주-몇달씩 걸릴 수 있습니다.


이것을 해결해 주는 것이 표준입니다. 표준을 지킨 데이터는 항상 동일한 구조와 품질을 유지되어, 누구라도 쉽게 사용할 수 있고 빠르게, 효율적으로 전달될 수 있습니다.


하지만, 공간정보 표준은 지키기가 쉽지 않습니다. 공간정보 표준인 ISO 19000 시리즈는 40여가지나 되는데다가 왠만한 전문가들도 무슨 뜻인지 이해하기 힘듧니다. 무엇보다 공간정보 제작자가 표준에 대한 인식이 높지 않고, 표준을 지킬 의지가 없습니다. 표준을 지키려면 훨씬 더 높은 기술이 필요하며, 더 많은 비용이 투자되어야 하지만, 돌아오는 혜택은 거의 없기 때문입니다.


표준을 지키려고 하면 제도적인 면과 기술적인 면을 생각해야 합니다. 제도적으로는 표준을 장려하는 정도가 아니라 반드시 지킬 수 있도록 하고, 그에 대한 반대급부를 마련해야 할 것입니다. 물론 정말 어려운 일입니다. 많은 사람들의 이해관계가 얽혀 있기 때문에 합의를 이루기도 힘들죠.


기술적인 해결책도 쉽지는 않습니다. 하지만, 그래도 명확한 답은 존재합니다. 적어도 표준을 따르는 데이터를 제작하는 것은 명백한 답이 존재합니다. 바로 데이터를 제작하기전, 어떤 데이터를 만들 것인지를 규정하는 제품사양서를 만들고, 이 제품사양서에 따라서 데이터를 제작하고, 제품사양서에 정한 것에 따라 품질을 검사해서 메타데이터를 제작하는 것입니다. 데이터를 공급할 때는 데이터 그자체 뿐만 아니라, 제품사양서+데이터, 혹은 메타데이터+데이터의 형태로 공급하면 됩니다. 제품사양서나 메타데이터에는 데이터 제품에 대한 이력부터 제작, 내용 및 구조가 모두 담겨져 있기 때문입니다. 



이처럼 제품사양서에는 데이터 제품 제작의 모든 것이 담겨 있다고 할 수 있습니다. 하지만 제품사양서를 제작한다는 것은 관련 표준을 모두 지켜야 함을 의미합니다. 아래 그림은 데이터제품사양서와 관련된 표준들입니다. 최소한 11가지 이상을 지켜야 합니다. 이중에서 가장 중요하면서도 긴밀히 얽혀 있고 가장 내용이 많으며, 어려운 것이 4. 데이터 내용과 구조, 6. 데이터품질, 12. 메타데이터 입니다. 



쉽지는 않다고 해도, 제도적으로 밀어붙였다면 사실 충분히 해결할 수 있습니다. 그럼에도 불구하고.. 벌써 우리나라에서 GIS가 도입되기 시작한지 20년 이상 흐른 지금까지도 데이터 공개, 표준 이런 이야기가 나온다는 현실이 많이 우울하네요.


민, 푸른하늘