본문 바로가기

IT 와 Social 이야기/Relational Data Modeling 프리미엄 가이드 - 김기창9

05 데이터 통합 (Generalization) - 유사한 성격의 데이터, 동질성을 가진 데이터를 더 큰 주제로 합치는 것 - 통합 대상에는 속성과 관계, 엔터티가 있지만 대부분 엔터티 통합이 주를 이룬다. - 속성과 엔터티에 대한 명확한 이해가 선행돼야 하므로 정규화를 끝낸 다음에 엔터티를 통합해야 데이터 성격에 맞는 유연한 모델이 된다. - 엔터티를 어떻게 정의하느냐에 따라 데이터 통합의 기준이 달라질 수 있다. - 완전 정규형을 사용해 데이터 통합(일반화) 작업을 수행하고 비정규화가 필요하면 통합된 모델에서 수행한다. - 업무가 바뀔 가능성이 많을수록 데이터를 일반화 시켜야 한다. - 성격, 정체성, 주제 등으로 판단했을 때 동질성이 빈약한 데이터를 통합하는 것은 주의해야 한다. - 엔터티를 통합하면 데이터는 많아질 수밖에 없다. 그러면 성능상 .. 2019. 12. 18.
04 정규화 (Normalization) 5 - 4정규형 다가 종속 개념이 기반이 되는 정규형이다. 다가 종속(MVD: Multivalued Dependency): 한 릴레이션에 다가 속성(Multivalued Attributed)이 두 개 이상 존재할 때 발생할 수 있다. 즉 하나의 다 속성의 모든 값이 다른 다가 속성의 모든 값마다 중복되는 문제점이 발생할 수 있는데 이를 다가 종속이라 한다. 즉 두 개의 독립적인 일대다(1:M) 관계의 속성이 동일한 릴레이션에 존재하면 다가 종속이 발생한다. 속성 A의 하나의 값이 속성 B의 여러 값을 결정하면 A →→ B로 표시하며 'A가 B를 다가 결정(Multidetermine)한다'. 또는 'B가 A에 다가 종속(Multidependent)됐다.라고 한다. 아래 릴레이션은 다가 종속의 사례이다. 사원은.. 2019. 10. 21.
04 정규화 (Normalization) 4 - 3정규형 3정규형은 이행적 종속성과 관련 있다. 이행적 종속성(Transitive Dependency): 만약 Y가 X에 종속되고 Z가 Y에 종속되면 Z는 Y에 종속된다고 추론하는 것 즉 X → Y이고 Y → Z이면 X → Z가 성립한다. 이때 Y는 릴레이션의 후보 식별자도 아니고 후보 식별자의 일부도 아닌 일반 속성이다. 일반 속성(비식별 속성) 간의 종속 관계를 분해하면 3정규형이 된다. 위 그림에서 속성 C는 일반 속성이면서 속성 D의 결정자(Determinant) 이기도 하다. 속성 D는 종속자(Dependent)이면서 주 식별자의 이행 종속 속성이다. 즉 속성 D는 주 식별자인 A와 B에 간접 종속돼 있다. 릴레이션은 직접적인 함수 종속에 의해서 분해해야 한다. 즉 아래와 같이 속성 C와 D.. 2019. 10. 21.
04 정규화 (Normalization) 3 - 2정규형 후보 식별자 속성과 일반 속성 간의 종속성에 의해 수행된다. 릴레이션의 모든 속성이 후보 식별자 전체에 종속적이면 2정규형이다. 모든 비식별자 속성은 후보 식별자 속성에 완전 함수 종속(Fully Functional Dependency)돼야 한다. 부분 함수 종속으로 말미암아 발생한 중복 데이터를 제거하는 것이 2정규화다. 만약 일반 속성 중에 후보 식별자 전체에 종속적이지 않고 후보 식별자를 구성하는 속성 일부에 종속(Partial Functional Dependency)적인 속성이 있다면 중복이 발생했으므로 그 속성을 릴레이션에서 분리해야 2정규형이 된다. 위 그림에서 C속성은 후보 식별자(주 식별자)의 일부분인 B속성에만 종속돼 부분 함수 종속(Partial Functional Depe.. 2019. 9. 30.