logo
  • Programação Web
    • React
    • Golang para web
      • Go – App Web com Redis
      • Fiber
    • Django
      • App Polls
      • Loja virtual – Ecommerce
  • Programação
    • Computação Quântica
    • Análise e Complexidade de Algoritmos
    • Python
    • R
    • C
    • Go
    • Javascript
      • Fundamentos do javascript
      • Web Audio API com Javascript
      • React native
  • Big Data / IA
    • Tutorial Hadoop
    • Data Science com R
    • Certificação Hortonworks Hadoop
    • Aprendizado de Máquina – Machine Learning
      • Sistemas Multi-Agentes
      • Python – Scikit-Learn
      • Python – TensorFlow – Keras – Redes Neurais
      • Python – Pacote Face Recognition
  • Games
    • Games em python
  • DevOps
    • AWS
    • DevOps Conceitos
    • Git
    • Docker
    • Kubernates
  • Notícias
  • Sobre

PySpark

Date Title Views Comments
  • Date
  • Title
  • Views
  • Comments

Aula 06 – Contagem de palavras com PySpark

toticavalcanti
0 0

Contagem de palavras com PySpark Link da documentação oficial do Hadoop: http://hadoop.apache.org/ Link do meu Github: https://github.com/toticavalcanti O SPARK É UMA ESTRUTURA DE PROCESSAMENTO BIG DATA, OPENSOURCE DESENVOLVIDA PARA TER VELOCIDADE, FACILIDADE DE USO E POSSIBILTAR ANÁLISE DE DADOS SOFISTICADAS O SPARK PODE SER 100X MAIS RÁPIDO QUE O HADOOP PARA PROCESSAMENTO DE DADOS EM […]

Aula 07 – Wordcount com PySpark continuação

toticavalcanti
0 0

Wordcount com PySpark Link da documentação oficial do Hadoop: http://hadoop.apache.org/ Link do meu Github: https://github.com/toticavalcanti Essa aula é uma continuação da passada, vamos fazer a mesma coisa executar só que ao invés de digitar comando por comando no Shell PySpark como fizemos na aula passada, iremos salvar o script inteiro em um arquivo .py, podemos […]

Aula 10 – Análise de sentimento com Flume / Twitter 02

toticavalcanti
0 2

Análise de sentimento com Flume e Twitter SEGUNDA PARTE Link da documentação oficial do Hadoop: http://hadoop.apache.org/ Link do meu Github: https://github.com/toticavalcanti VAMOS TENTAR USAR O TIPO DE SOURCE com.cloudera.flume.source.TwitterSource AO INVÉS DO org.apache.flume.source.twitter.TwitterSource SEM FAZER NENHUMA MODIFICAÇÃO NA MÁQUINA CLOUDERA . NO ARQUIVO flume_twitter.conf  VAMOS DESCOMENTAR A LINHA ABAIXO, RETIRANDO A TRALHA (#) DO INÍCIO: TwitterAgent.sources.Twitter.type = […]

Aula 12 – Análise de sentimento com Flume / Twitter 04

toticavalcanti
0 2

Análise de sentimento com Flume e Twitter QUARTA PARTE Link da documentação oficial do Hadoop: http://hadoop.apache.org/ Link do meu Github: https://github.com/toticavalcanti CONTINUANDO COM A CONSTRUÇÃO DA APLICAÇÃO DE ANÁLISE DE SENTIMENTO. CONSTRUÇÃO DO SCRIPT PYSPARK PARA A ANÁLISE FOI UTILIZADO O SPARK, UMA TECNOLOGIA DE COMPUTAÇÃO DISTRIBUÍDA EM CLUSTER, EXTREMAMENTE RÁPIDA. EXISTEM MUITOS MÉTODOS E […]

© 2024 Toti Cavalcanti
    • Close
    • Programação Web
      • React
      • Golang para web
        • Go – App Web com Redis
        • Fiber
      • Django
        • App Polls
        • Loja virtual – Ecommerce
    • Programação
      • Computação Quântica
      • Análise e Complexidade de Algoritmos
      • Python
      • R
      • C
      • Go
      • Javascript
        • Fundamentos do javascript
        • Web Audio API com Javascript
        • React native
    • Big Data / IA
      • Tutorial Hadoop
      • Data Science com R
      • Certificação Hortonworks Hadoop
      • Aprendizado de Máquina – Machine Learning
        • Sistemas Multi-Agentes
        • Python – Scikit-Learn
        • Python – TensorFlow – Keras – Redes Neurais
        • Python – Pacote Face Recognition
    • Games
      • Games em python
    • DevOps
      • AWS
      • DevOps Conceitos
      • Git
      • Docker
      • Kubernates
    • Notícias
    • Sobre