logo
  • Programação Web
    • React
    • Golang para web
      • Go – App Web com Redis
      • Fiber
    • Django
      • App Polls
      • Loja virtual – Ecommerce
  • Programação
    • Computação Quântica
    • Análise e Complexidade de Algoritmos
    • Python
    • R
    • C
    • Go
    • Javascript
      • Fundamentos do javascript
      • Web Audio API com Javascript
      • React native
  • Big Data / IA
    • Tutorial Hadoop
    • Data Science com R
    • Certificação Hortonworks Hadoop
    • Aprendizado de Máquina – Machine Learning
      • Sistemas Multi-Agentes
      • Python – Scikit-Learn
      • Python – TensorFlow – Keras – Redes Neurais
      • Python – Pacote Face Recognition
  • Games
    • Games em python
  • DevOps
    • AWS
    • DevOps Conceitos
    • Git
    • Docker
    • Kubernates
  • Notícias
  • Sobre

Tutorial Hadoop

Date Title Views Comments
  • Date
  • Title
  • Views
  • Comments

Aula 05 – Configuração e comandos básicos Hadoop

toticavalcanti
0 2

Configuração da máquina Cloudera Link para o download da máquina: https://www.cloudera.com/downloads/quickstart_vms/5-13.html Link da documentação oficial do Hadoop: http://hadoop.apache.org/ Link para download do virtual box: https://www.virtualbox.org/wiki/Downloads/ Link para o download do putty: https://www.putty.org/ Link para o download do WINSCP: https://winscp.net/eng/download.php Link do meu Github: https://github.com/toticavalcanti Arquivo zipado Configurações da máquina cloudera Depois de unzipar o arquivo, […]

Aula 09 – Análise de sentimento com Flume / Twitter 01

toticavalcanti
0 2

Análise de sentimento com Flume e Twitter PRIMEIRA PARTE Link da documentação oficial do Hadoop: http://hadoop.apache.org/ Link do meu Github: https://github.com/toticavalcanti AVISO: As 3 aulas a seguir referentes a Análise de sentimento com Flume e Twitter, infelizmente não funciona mais na prática, a máquina cloudera usada na aula ficou desatualizada e foi descontinuada pela empresa. […]

Aula 10 – Análise de sentimento com Flume / Twitter 02

toticavalcanti
0 2

Análise de sentimento com Flume e Twitter SEGUNDA PARTE Link da documentação oficial do Hadoop: http://hadoop.apache.org/ Link do meu Github: https://github.com/toticavalcanti VAMOS TENTAR USAR O TIPO DE SOURCE com.cloudera.flume.source.TwitterSource AO INVÉS DO org.apache.flume.source.twitter.TwitterSource SEM FAZER NENHUMA MODIFICAÇÃO NA MÁQUINA CLOUDERA . NO ARQUIVO flume_twitter.conf  VAMOS DESCOMENTAR A LINHA ABAIXO, RETIRANDO A TRALHA (#) DO INÍCIO: TwitterAgent.sources.Twitter.type = […]

Aula 12 – Análise de sentimento com Flume / Twitter 04

toticavalcanti
0 2

Análise de sentimento com Flume e Twitter QUARTA PARTE Link da documentação oficial do Hadoop: http://hadoop.apache.org/ Link do meu Github: https://github.com/toticavalcanti CONTINUANDO COM A CONSTRUÇÃO DA APLICAÇÃO DE ANÁLISE DE SENTIMENTO. CONSTRUÇÃO DO SCRIPT PYSPARK PARA A ANÁLISE FOI UTILIZADO O SPARK, UMA TECNOLOGIA DE COMPUTAÇÃO DISTRIBUÍDA EM CLUSTER, EXTREMAMENTE RÁPIDA. EXISTEM MUITOS MÉTODOS E […]

Aula 03 – Configuração da máquina Cloudera

toticavalcanti
0 2

Configuração da máquina Cloudera Link para o download da máquina: https://www.cloudera.com/downloads/quickstart_vms/5-13.html Link da documentação oficial do Hadoop: http://hadoop.apache.org/ Link para o download do putty: https://www.putty.org/ Link para o download do WINSCP: https://winscp.net/eng/download.php Link do meu Github: https://github.com/toticavalcanti Arquivo zipado Configurações da máquina cloudera Depois de unzipar o arquivo, é necessário fazer algumas configurações Acessando a […]

Aula 16 – Hadoop – Tutorial Apache Pig

toticavalcanti
0 0

Aula 16 – Hadoop – Tutorial Apache Pig Aula anterior                                       Próxima aula Página principal Se gostarem do conteúdo dêem um joinha 👍 na página do Código Fluente no Facebook Esse é o link do código fluente no Pinterest Meus links de afiliados: Hostinger […]

Aula 06 – Contagem de palavras com PySpark

toticavalcanti
0 0

Contagem de palavras com PySpark Link da documentação oficial do Hadoop: http://hadoop.apache.org/ Link do meu Github: https://github.com/toticavalcanti O SPARK É UMA ESTRUTURA DE PROCESSAMENTO BIG DATA, OPENSOURCE DESENVOLVIDA PARA TER VELOCIDADE, FACILIDADE DE USO E POSSIBILTAR ANÁLISE DE DADOS SOFISTICADAS O SPARK PODE SER 100X MAIS RÁPIDO QUE O HADOOP PARA PROCESSAMENTO DE DADOS EM […]

Aula 17 – Hadoop – Cloudera Quickstart com docker

toticavalcanti
0 0

Aula 17 – Hadoop – Cloudera Quickstart com docker Aula anterior                                            Próxima aula Página principal Meu github: https://github.com/toticavalcanti Meu Canal de Música: https://www.youtube.com/channel/UCUEtjLuDpcOvR3mIUr-viOA Meu canal de Backing track / Play-along: https://www.youtube.com/channel/UCT3TryVMqTqYBjf5g5WAHfA O canal do código fluente no youtube https://www.youtube.com/channel/UCgn-O-88XBAwdG9gUWkkb0w Fiquem a […]

Aula 07 – Wordcount com PySpark continuação

toticavalcanti
0 0

Wordcount com PySpark Link da documentação oficial do Hadoop: http://hadoop.apache.org/ Link do meu Github: https://github.com/toticavalcanti Essa aula é uma continuação da passada, vamos fazer a mesma coisa executar só que ao invés de digitar comando por comando no Shell PySpark como fizemos na aula passada, iremos salvar o script inteiro em um arquivo .py, podemos […]

Aula 18 – Hadoop – Instalação do Hadoop 3 no Ubuntu 20.04.1

toticavalcanti
0 0

Aula 18 – Hadoop – Instalação do Hadoop 3 no Ubuntu 20.04.1 Aula anterior                                            Próxima aula Página principal Meu github: https://github.com/toticavalcanti Meu Canal de Música: https://www.youtube.com/channel/UCUEtjLuDpcOvR3mIUr-viOA Meu canal de Backing track / Play-along: https://www.youtube.com/channel/UCT3TryVMqTqYBjf5g5WAHfA O canal do código fluente no youtube […]

Aula 08 – Ingestão de dados com o Flume

toticavalcanti
0 0

Ingestão de dados com o Flume Link da documentação oficial do Hadoop: http://hadoop.apache.org/ Link do meu Github: https://github.com/toticavalcanti   DEFINIÇÃO O FLUME É UM SERVIÇO DE INGESTÃO DE DADOS PARA COLETAR, AGREGAR E TRANSPORTAR GRANDES QUANTIDADES DE FLUXO DE DADOS (STREAMING), COMO POR EXEMPLO: ARQUIVOS DE LOG, EVENTOS, DADOS DE REDES SOCIAIS, SENSORES, ETC. DE […]

Aula 11 – Análise de sentimento com Flume / Twitter 03

toticavalcanti
0 0

Análise de sentimento com Flume e Twitter TERCEIRA PARTE Link da documentação oficial do Hadoop: http://hadoop.apache.org/ Link do meu Github: https://github.com/toticavalcanti CONTINUANDO COM A CONSTRUÇÃO DA APLICAÇÃO DE ANÁLISE DE SENTIMENTO. COMO VAMOS UTILIZAR O HIVE, VAMOS CONHECER UM POUCO SOBRE ELE HIVE O HIVE É UM SISTEMA DE DATA WAREHOUSE OPENSOURCE, USADO PARA CONSULTAR […]

Tutorial Hadoop

Aula 01 – Introdução ao Hadoop File System

toticavalcanti
0 0

Introdução ao Hadoop File System Links da documentação oficial: http://hadoop.apache.org/ Github: https://github.com/toticavalcanti HADOOP – INTRODUÇÃO É UMA PLATAFORMA DE COMPUTAÇÃO DISTRIBUÍDA VOLTADA PARA CLUSTERS E PROCESSAMENTO DE GRANDES VOLUMES DE DADOS É UM SISTEMA OPERACIONAL PARA BIG DATA CÓDIGO ABERTO CRIADO POR DOUG CUTTING DO GOOGLE LABS EM 2005 CRIAÇÃO MOTIVADA PELO DESAFIO DA ESCALABILIDADE PARA CONSEGUIR […]

Aula 02 – Introdução ao Map-Reduce

toticavalcanti
0 0

Introdução ao Map-Reduce Link da documentação oficial: http://hadoop.apache.org/ Github: https://github.com/toticavalcanti O MAPREDUCE DIVIDE VOLUMES IMENSOS DE DADOS EM PARTES PEQUENAS, QUE SÃO ENTÃO ESPALHADAS POR MUITOS COMPUTADORES EM VEZ DE MOVER DADOS PARA UM SOFTWARE DE PROCESSAMENTO – O QUE SERIA LENTO COM VOLUMES GRANDES DE DADOS – O PROCESSAMENTO É MOVIDO PARA ONDE ESTÃO OS DADOS, […]

Aula 13 – Apache Sqoop – Hadoop e SGBDR

toticavalcanti
0 0

Apache Sqoop Ferramentas do ecossistema Hadoop para big data analytics Mas afinal, o que é sqoop? Para que serve o sqoop? E quando devo usar o sqoop? Espero que esse post deixe todas essas perguntas bem claras para vocês. Então, vamos a um pouco de sua história. O Apache Sqoop (TM) foi projetado para transferir […]

Apache Sqoop

Aula 14 – Apache Sqoop – Continuação 01

toticavalcanti
0 0

Apache Sqoop – Big Data Analytics Ferramentas de big data analytics do ecossistema hadoop O Apache Sqoop intermedia o Hadoop file system e bancos relacionais (SGBDR) Esse é o link da documentação oficial: http://sqoop.apache.org/ Continuando Vamos agora importar todas as tabelas do retail_db do mysql para o hdfs no formato Avro. Na aula passada foi explicado […]

Aula 04 – HDFS – YARN e os tipos de nós

toticavalcanti
0 0

HDFS,YARN e os tipos de nós Link da documentação oficial do Hadoop: http://hadoop.apache.org/ Link para o download do putty: https://www.putty.org/ Link para o download do WINSCP: https://winscp.net/eng/download.php Link do meu Github: https://github.com/toticavalcanti COMPONENTES PRINCIPAIS DO HADOOP O HADOOP POSSUI DOIS COMPONENTES PRINCIPAIS QUE IMPLEMENTAM O ARMAZENAMENTO E O PROCESSAMENTO DISTRIBUÍDO: O HDFS QUE GERENCIA OS […]

Apache Sqoop

Aula 15 – Apache Sqoop – Continuação 02

toticavalcanti
0 0

Apache Sqoop – Big Data Analytics Ferramentas de big data analytics do ecossistema hadoop O Apache Sqoop é uma ferramenta que intermedia o Hadoop file system e bancos relacionais (SGBDR) Antes de começar, quero deixar meu link de afiliados na Hostinger, tá valendo a pena, dêem uma olhada: Hostinger Dêem um joinha ? na página […]

© 2024 Toti Cavalcanti
    • Close
    • Programação Web
      • React
      • Golang para web
        • Go – App Web com Redis
        • Fiber
      • Django
        • App Polls
        • Loja virtual – Ecommerce
    • Programação
      • Computação Quântica
      • Análise e Complexidade de Algoritmos
      • Python
      • R
      • C
      • Go
      • Javascript
        • Fundamentos do javascript
        • Web Audio API com Javascript
        • React native
    • Big Data / IA
      • Tutorial Hadoop
      • Data Science com R
      • Certificação Hortonworks Hadoop
      • Aprendizado de Máquina – Machine Learning
        • Sistemas Multi-Agentes
        • Python – Scikit-Learn
        • Python – TensorFlow – Keras – Redes Neurais
        • Python – Pacote Face Recognition
    • Games
      • Games em python
    • DevOps
      • AWS
      • DevOps Conceitos
      • Git
      • Docker
      • Kubernates
    • Notícias
    • Sobre