본문 바로가기

impala

Cloudera Tuning Impala for Performance (CDH 5.1.X) cloudera.com CDH 5.1.x 메뉴얼을 요약한 글입니다. 이에 앞서 Hardware Requirements 가 충족 됨을 사전 확인해야 한다. 특히 Memory 에 대해서는 128 GB 혹은 그 이상이 추천되며, 이상적으로는 256GB 이상을 추천한다. 만약 쿼리 수행 중 중간 결과가 어느 노드의 임팔라가 가용 가능한 메모리를 다 소진하게 되면해당 쿼리는 취소된다. 일반적으로 중간 결과들은 원본 데이타보다 작아지고, 일 또한 병렬로 수행되기 때문에임팔라는 각 노드의 가용 가능한 메모리보다 더 큰 데이타에 대해 질의나 조인을 수행할 수 있다. 성능에 영향을 미치는 요소- Partitioning- Performance Considerations for Join Queries- Table Stati.. 더보기
Cloudera Impala Architecture ( CDH 5.1.X ) http://www.cloudera.com 번역한 글입니다. - A COLUMNAR STORAGE LAYOUT- IMPALA 는 HDFS 혹은 HBASE 에 저장 되어 있는 데이타에 쿼리(질의) 한다.- SQL Syntax (Hive SQL), ODBC driver, UI (HUE 에서 제공) ( http://www.cloudera.com/ 에서 가져온 이미지 입니다.) Hive Metastore - Impala 에 사용 가능한 데이터에 대한 정보를 저장 어떤 데이타베이스를 사용할 수 있고 그 구조가 어떻게 되는지를 가진다. Cloudera Impala - DataNodes 에 구성 되며, 쿼리를 실제 수행하는 주체. Impala 를 사용하는 실행되는 쿼리들은 다음과 같이 수행된다. 1. User app.. 더보기