728x90
[trino] trino(Presto SQL)란?
Trino
Trino는 빅데이터 분석을 위한 분산 SQL 쿼리 엔진
PrestoSQL을 리브랜딩 한 것으로,
데이터 웨어하우스, 데이터 레이크 및 다른 데이터 저장소에 저장된 대량의 데이터에 쿼리를 하기 위해 설계됨
🔎Presto
페이스북이 최초로 개발하여, 오픈 소스로 공개한 대화식 데이터 쿼리 서비스
데이터베이스에 대한 일관된 ANSI SQL 질의가 가능
SQL 쿼리 엔진이란 무엇일까? 데이터 베이스나 데이터 처리 시스템에서 사용되는 소프트웨어 컴포넌트 주어진 데이터에 대해 사용자가 요청한 정보를 추출하기 위해 쿼리를 실행하고 결과를 반환 SQL 또는 다른 쿼리 언어로 작성된 쿼리를 해석하고 실행 쿼리엔진은 DBMS의 일부로 내장되어 있을 수도 있으며, 독립적인 소프트웨어로 제공될 수도 있음 |
특징
- 빠른 속도를 보장하기 위해 엔진 레벨에서 분산 컴퓨팅 기법이 사용됨
- 새로운 복잡한 언어를 학습하지 않고, 기존 SQL 기술을 사용하여 빅데이터을 쿼리 할 수 있음
- HDFS, Amazon S3, GCS, Azure Storge 등 분산 스토리지 시스템을 Hive 커넥터를 통해 쿼리할 수 있음 (아래 링크 참고)
✔ 결론
Trino는 분산 SQL 쿼리 엔진으로 대량의 데이터를 실시간으로 쿼리하고 분석하는데 적합하다
보통 Hive Connector와 연동하여 많이 사용하는 듯
Amazon Athena가 Trino (Presto) 쿼리 엔진을 기반으로 구축되었다고 함
반응형
'💾 Data > etc' 카테고리의 다른 글
[Superset] 차트에 HyperLink 걸기 (0) | 2023.07.11 |
---|---|
[Hive] Apache Hive란? (0) | 2023.06.01 |
[Superset] DB 연동 (0) | 2023.05.15 |
[Superset] Apache Superset 설치 (0) | 2023.05.13 |
[Superset] Apache Superset (0) | 2023.05.12 |