hive

💾 Data/etc

[Hive] Apache Hive란?

[Hive] Apache Hive Hive Apache Hive는 대용량 데이터를 처리하고 분석하기 위해 구축된 데이터 웨어하우징 솔루션 Hive는 데이터를 Hadoop Distributed File System (HDFS)와 같은 분산 파일 시스템에 저장하고 SQL과 유사한 Hive Query Language (HQL)을 사용하여 데이터를 쿼리하고 처리 Hive는 맵 리듀스 기반의 분산 처리를 활용하여 데이터를 처리하므로, 대용량 데이터셋에 대한 쿼리 및 분석 작업을 효율적으로 수행할 수 있음 데이터에 대한 메타 데이터를 관리하고, 쿼리를 실행하기 전에 데이터를 맵리듀스 작업으로 변환하여 처리함 하둡 (Hadoop) 대규모 데이터를 분산 처리하기위한 오픈 소스 프레임워크로 GFS와 맵리듀스 개념을 기반..