본문 바로가기

명사 美 비격식 (무리 중에서) 아주 뛰어난[눈에 띄는] 사람[것]

이론

데이터 워크플로우, 스케줄링 및 모니터링을 관리하는 Apache Airflow

Apache Airflow
Apache 소프트웨어 재단에서 개발
데이터 워크플로우, 스케줄링 및 모니터링을 관리하기 위한 오픈 소스 플랫폼
비정형 데이터 처리 및 워크플로우 자동화를 위한 도구로 널리 사용



아래는 주요 특징과 기능이다.


유연한 워크플로우 정의
Airflow는 코드로 워크플로우를 정의하고, DAG(Directed Acyclic Graph)라는 형태로 워크플로우를 표현
사용자는 다양한 작업들을 조립하여 복잡한 데이터 워크플로우를 정의할 수있다.

스케줄링과 실행
사용자는 작업들을 특정 시간에 주기적으로 실행하도록 스케줄링할 수 있다.

다양한 작업 유형 지원
Airflow는 다양한 유형의 작업을 지원합니다. Bash 스크립트, Python 스크립트, SQL 쿼리 실행, 데이터 전송, 온라인 분석 처리 등 다양한 작업들을 수행할 수있다.

모듈화 및 확장성
다양한 플러그인을 통해 다양한 데이터 소스 및 대상, 연산자, 센서 등을 지원하며, 사용자가 필요에 따라 확장할 수 있다.

웹 기반 사용자 인터페이스
웹 기반의 사용자 인터페이스를 제공하여 사용자가 워크플로우를 시각적으로 모니터링하고 관리할 수 있다.

모니터링 및 알림
실행 중인 워크플로우의 상태를 모니터링하고, 성공 또는 실패와 같은 이벤트에 따라 알림을 설정할 수 있다.

메타데이터 저장소
메타데이터 저장소에 워크플로우 실행 상태 및 로그를 저장하므로, 실행 기록을 추적하고 검토할 수 있다.

커뮤니티 및 생태계
활발한 커뮤니티와 다양한 확장 플러그인을 제공하며, 다양한 사용자들이 기여하고 있다.