본문 바로가기

Cloudera

CLOUDERA CDH 5.1 -> 5.2 업그레이드 시 에러 해결 CDH 5.1 -> 5.2 참고 : https://sskaje.me/2014/10/manually-upgrade-cdh-5-2-cm-5/#.VFiPRyLkfz0 사용자 환경 ZOO KEEPERHDFSHIVEIMPALA Cloudera 에서 이야기 하는 5.1 -> 5.2 가이드를 따라 업그레이드 하다 보면Hive metastore server 의 스키마 업그레이드에서 다음의 에러와 함께 진행이 불가할 때가 있다. Error: ERROR: language "plpgsql" does not exist 위 경우 다음의 명령어를 통해 해결할 수 있다. # sudo -u hive createlang plpgsql hive -p 7432 이후 패스워드를 물어보는데, 패스워드는 아래에서 확인할 수 있다./var/ru.. 더보기
Cloudera Tuning Impala for Performance (CDH 5.1.X) cloudera.com CDH 5.1.x 메뉴얼을 요약한 글입니다. 이에 앞서 Hardware Requirements 가 충족 됨을 사전 확인해야 한다. 특히 Memory 에 대해서는 128 GB 혹은 그 이상이 추천되며, 이상적으로는 256GB 이상을 추천한다. 만약 쿼리 수행 중 중간 결과가 어느 노드의 임팔라가 가용 가능한 메모리를 다 소진하게 되면해당 쿼리는 취소된다. 일반적으로 중간 결과들은 원본 데이타보다 작아지고, 일 또한 병렬로 수행되기 때문에임팔라는 각 노드의 가용 가능한 메모리보다 더 큰 데이타에 대해 질의나 조인을 수행할 수 있다. 성능에 영향을 미치는 요소- Partitioning- Performance Considerations for Join Queries- Table Stati.. 더보기
Cloudera Impala Architecture ( CDH 5.1.X ) http://www.cloudera.com 번역한 글입니다. - A COLUMNAR STORAGE LAYOUT- IMPALA 는 HDFS 혹은 HBASE 에 저장 되어 있는 데이타에 쿼리(질의) 한다.- SQL Syntax (Hive SQL), ODBC driver, UI (HUE 에서 제공) ( http://www.cloudera.com/ 에서 가져온 이미지 입니다.) Hive Metastore - Impala 에 사용 가능한 데이터에 대한 정보를 저장 어떤 데이타베이스를 사용할 수 있고 그 구조가 어떻게 되는지를 가진다. Cloudera Impala - DataNodes 에 구성 되며, 쿼리를 실제 수행하는 주체. Impala 를 사용하는 실행되는 쿼리들은 다음과 같이 수행된다. 1. User app.. 더보기