Aula 08 – Tarefa 06 do simulado da prova de certificação HDP Hortonworks

Certificação Hortonworks Hadoop FS – Certificação HDP hortonworks

Simulado da prova de certificação HDP Hortonworks

TAREFA 06

Analisando dados com o Hive

Escreva uma consulta em HiveQL e salve as consultas em um único arquivo de texto chamado /home/horton/solutions/flightdelays.hive para cada uma das tarefas abaixo:

  1.  Calcule o arrdelay médio dos voos que desembarcam em Denver (dest é igual a “DEN”)
  2.  Calcule o arrdelay médio de voos onde a origem é LAX e o dest é SFO
  3.  Determine qual aeroporto de destino teve o arrdelay médio mais alto

Script

Passo 1.
select avg(arrdelay) from flightdelays where dest = 'DEN';
Resultado é 7.26 minutos

Passo 2.
select avg(arrdelay) from flightdelays where origin = 'LAX' and dest = 'SFO';
Resulto é 62.5 minutos

Passo 3.
from flightdelays select dest, avg(arrdelay) as delay group by dest order by delay asc;

NOTA: Existem muitas maneiras de encontrar o arrdelay mais alto, mas a resposta é “SFO” com um valor de cerca de 55 minutos.

Obrigado

Até a próxima

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *