Apache Atlas
Hadoop 생태계에서 데이터 관리와 데이터 자산 관리를 위한 오픈 소스 프로젝트
데이터 자산의 메타데이터 관리 및 검색을 지원하여 기업 내에서 데이터 자산을 추적하고 이해하는 데 도움
주요 특징과 기능은 아래와 같다.
메타데이터 관리
다양한 데이터 소스에서 발생하는 메타데이터를 수집하고 저장
데이터 자산의 소유자, 종속성, 품질, 라이프사이클 등을 추적
분류 및 태깅
데이터에 태그를 부여하고, 비즈니스 규칙에 따라 데이터를 분류하는 기능을 제공
데이터 라인어리
데이터 자산 간의 종속성을 시각화하고, 데이터 라인어리를 생성하여 데이터 흐름을 이해하는 데 도움
검색 및 브라우징
Apache Atlas는 웹 기반의 사용자 인터페이스를 통해 메타데이터를 검색하고 브라우징할 수 있는 기능을 제공
보안 및 규정 준수
데이터 자산에 대한 액세스 제어 및 보안 정책을 설정하여 데이터 보안을 강화하고, 규정 준수를 유지
플러그인 확장성
다양한 데이터 소스 및 기존 메타데이터 저장소와 통합하기 위한 플러그인 확장성을 제공
'이론' 카테고리의 다른 글
클라우드에서 안정적이고 효율적인 워크로드를 설계하다, Well Architected 설계원칙 (0) | 2024.01.22 |
---|---|
Hadoop 기반의 데이터 플랫폼에서 보안 및 접근 제어를 관리하는 Apache Ranger (0) | 2024.01.19 |
데이터 워크플로우, 스케줄링 및 모니터링을 관리하는 Apache Airflow (0) | 2024.01.19 |
데이터 플로우 자동화 및 데이터 통합 오픈 소스, Apache NiFi (0) | 2024.01.19 |
대용량 데이터 웨어하우스 및 분석용 데이터베이스, Greenplum (0) | 2024.01.19 |