////
Search

공간 데이터 Type과 Notations

태그
Basics
목차

1. 공간 데이터(Spatial Data)의 정의

공간 데이터(Spatial Data)지리적으로 서로 연관되어 있는 또는 의존적인 데이터들을 의미한다. 공간적으로 의존적이라 함은 특정 위치의 데이터가 어떠한 다른 위치의 데이터에 영향을 준다는 것을 뜻한다. 이때 영향을 주고 받는 방향은 모든 방향일 수도 있고 정해져있는 방향일 수도 있다. 일반적으로 거리가 멀어질수록 의존성은 떨어진다고 가정하지만 반드시 그런 것은 아니며 모델에 따라 다르다.

2. 공간 데이터의 Type

일반적으로 세 가지 카테고리로 공간 데이터를 나눠볼 수 있다.
1.
Geostatistical data
연속적인 공간에서 point의 형태로 되어 있는 데이터를 의미한다.
이때 데이터는 두 가지 정보를 담는다. 1) 위치값 2) 해당 위치에서의 특정한 정보값.
예를 들어, 특정한 좌표 지점의 온도를 생각했을 때, 좌표값은 위치값에 해당하며 해당 위치에서의 특정한 정보값은 온도가 될 것이다.
2.
Lattice (areal) data
지역의 domain이 셀 수 있게끔 고정되어 있는 데이터를 의미한다.
Geostatistical data와 마찬가지로 두 가지 정보를 담는다.
예를 들어, 서울시의 구들의 쓰레기 배출량이 areal data가 될 수 있다. 이때 구들은 셀 수 있게끔 고정되어 있다.
3.
Spatial point processes
Geostatistical data와 마찬가지로 연속적인 공간에서 point 형태로 되어있지만, 해당 위치에서의 정보값보다는 위치값 자체가 관심이 있는 경우를 의미한다.
예를 들어 데이터가 특정 clustering 패턴을 가지는지 알고 싶은 경우 우리는 위치값만 알면 된다.

3. 기본적인 Notations

dd 차원 공간에서의 공간 데이터는 다음과 같이 표기한다.
{Z(s):sDRd}\{ Z(s) : s \in D \subset R^d \}
ss: process Z(s)Z(s)가 관측되는 위치(location)을 뜻한다.
ss는 index set DD에 따라서 달라진다. 예를 들어, 3차원 공간에서 특정 Z(s)Z(s)가 존재할 수 있는 공간은 한정되어 있다.
Data들은 random field에서 추출된 sample 또는 realization으로 간주할 수 있다.

4. Spatial Domain의 특성

위에서의 spatial domain DD는 공간 데이터 type에 따라 각기 다른 특성을 지닌다.
1.
Geostatistical data: DD는 continuous fixed set
2.
Lattice data: DD는 discrete fixed set
3.
Point process: DD는 stochastic 이며 대체로 continuous. 일반적으로 Z(s)Z(s)는 관심 대상이 아니지만, 만약 관심이 있다면 marked point process라고 부른다.