본문 바로가기

명사 美 비격식 (무리 중에서) 아주 뛰어난[눈에 띄는] 사람[것]

이론/SCP Training & Certification

Samsung Cloud Platform Practitioner Essentials [8hr] - [KR]Practitioner.Analytics(1)_2312

Apache Kafka Managed 상품

웹기반 콘솔을 통해 Apache Kafka 클러스터를 생성하고 관리하는 상품

VM기반으로 Apache Kafka 자동설치

Apache Kafka 가동관리, 모니터링, 설정기능, VM/스토리지 크기변경 가능 등의 기능을 제공함.

GUI지원으로 비전문가도 비교적 쉽게 사용 가능

https://standout.tistory.com/1306

 

Data Analytics, 데이터 분석

Data Analytics 데이터 분석 데이터를 수집하고 분석하여 비즈니스 의사 결정에 도움을 주는 과정 데이터 수집 - 데이터 전처리 - 분석 모델 개발 - 시각화 및 해석 - 결과 적용 및 의사 결정 지원 - 실

standout.tistory.com

https://standout.tistory.com/1307

 

Apache Kafka, 대용량의 실시간 데이터 스트림처리

Apache Kafka Apache의 대용량의 실시간 데이터 스트림을 안정적으로 처리하기 위한 분산형 이벤트 스트리밍 플랫폼 개발 초기에 LinkedIn에서 시작, 이를 오픈 소스로 공개하고 Apache Kafka 프로젝트로

standout.tistory.com

 

 

 

Elasticsearch Managed 상품

VM기반으로 SCP표준 버전의 Elasticsearch 자동설치

웹콘솔을 활용하여 쉬운 사용가능

자체백업기능을 활용해 Object 스토리지에 저장하고

복구하거나 모니터링이 가능하다.

Enterprise 버전을 제공하여 머신러닝, 보안 및 데이터스트림, 인덱스 수명주기 관리 기능 등 전문가 서비스를 제공한다.

https://standout.tistory.com/1308

 

Elacticsearch, 실시간 검색 및 분석을 위한 오픈 소스 분산 검색 및 분석 엔진

Elacticsearch Apache Lucene을 기반으로 구축 실시간 검색 및 분석을 위한 오픈 소스 분산 검색 및 분석 엔진 대용량 데이터의 색인(indexing)과 검색을 효과적으로 처리 특징은 아래와 같다. 분산 아키텍

standout.tistory.com

 

 

 

Vertica DBaaS

VM기반으로 SCP표준 버전의 Vertica 자동설치

컬럼처리를 위한 별도 옵션이나 절차가 불필요하고

대용량 데이터 적재와 읽기업무에 최적화되어있다.

https://standout.tistory.com/1309

 

대량데이터 고성능 관리 시스템, Vertica

Vertica HP 에서 개발한 분산형 데이터베이스 관리 시스템(DBMS) 현재는 마이크로 포커스가 소유 대량의 데이터를 고성능으로 처리하고 분석할 수 있도록 설계 데이터 웨어하우징과 비즈니스 인텔

standout.tistory.com

https://standout.tistory.com/1279

 

DBaaS, 데이터베이스를 클라우드 기반으로 제공하는 서비스

DBaaS Database as a Service 데이터베이스를 클라우드 기반으로 제공하는 서비스 모델 기업이나 사용자가 데이터베이스 관리, 운영, 확장 등의 일부 또는 전체를 클라우드 제공자에게 위탁하고, 데이

standout.tistory.com

 

 

SQream 상품

설치형 데이터베이스 상품으로 제공된다.

압축알고리즘 처리가 가능하다.

NVIDIA CUDA 프레임워크를 활용한 MPP기능제공

병렬처리 엔진을 탑재하여 압축해제 없이 동시 질의 수행이 가능하다.

무한 수평적 확장이 가능한 클러스터 아키텍처를 제공해 데이터 처리시 Concurrency를 최대화할수 있다.

https://standout.tistory.com/1310

 

대규모 데이터와 신속한 응답을 제공하는 SQream DB

SQream DB 대규모 데이터 분석 환경에서 필요한 성능과 신속한 응답 시간을 제공하는데 중점을 둔 고성능 GPU 가속 데이터베이스 대규모 데이터 집합에 대한 실시간 분석을 지원하기 위해 설계된 GP

standout.tistory.com

 

 

Quick Query 상품

표준 SQL을 사용해 대용량 데이터를 간편하게 분석할 수 있는 대화형 쿼리 서비스

오픈소스 Trino를 통해 제공되어 병렬분산처리 및 자동으로 질의를 분할 해 대용량 데이터도 동시에 여러 노드에서 병렬처리하여 빠르게 질의결과를 확인 할 수 있다.

Object Storage, HDFS, Hive에 접속이 가능하다.

관계형데이터베이스에는 PostgreSQL, MariaDB, MS SQL Server, MySQL... 이 있다.

파일형식으로는 CSV, JSON, ORC, Auro, Parquet... 이 있는등 다양한 데이터 소스를 지원한다.

Jupyter Notebook을 통해 이 이력을 조회할 수 있고 결과를 확인/다운로드 할 수있다.

 

 

Greenplum 상품

VM기반으로 SCP표준 버전의 Greenplum 자동설치

Enterprise Analytics를 위한 대용량 정형/비정형 데이터 분석 플랫폼

클러스터 기반의 상품으로 데이터 노드에 대해 병렬처리 구조로 구성된다.

인-데이터베이스 머신러닝 기능으로 전체 데이터에 대한 머신러닝이 가능하다.

https://standout.tistory.com/1311

 

대용량 데이터 웨어하우스 및 분석용 데이터베이스, Greenplum

Greenplum 분산형 데이터베이스 관리 시스템(Distributed Database Management System, DBMS) 대용량 데이터 웨어하우스 및 분석용 데이터베이스로 사용 기업이 대규모 데이터셋을 효율적으로 저장, 관리, 분석

standout.tistory.com