Curso de Data Science
Aula 07 – Data Science – R – Caso do Titanic – Kaggle

Caso do Titanic – Kaggle
Continuando com o problema do Titanic proposto pelo Kaggle.
Já limpamos os campos Embarked e Age, agora vamos limpar o campo Fare.
Verificação agora do campo Fare (tarifa):
table(is.na(titanic.full$Fare))
Saída:
FALSE TRUE
1308 1
Ou seja, 1 registro não tem essa informação.
Vamos preencher o registro que falta essa informação com a mediana das tarifas.
#Pega a mediana das tarifas do conjunto total (titanic.full) desconsiderando
#os registros sem essa informação e atribuindo a variável fare.median
fare.median <- median(titanic.full$Fare, na.rm = TRUE)
#preenche os registros sem a informação de Fare com a mediana
titanic.full[is.na(titanic.full$Fare), “Fare"] <- fare.median
Rodando novamente:
table(is.na(titanic.full$Fare))
Saída:
FALSE
1309
Agora todos os registros tem a informação Fare.
Obrigado, até mais.
(Visited 84 times, 1 visits today)
Tags: analise de dados,
aprendizado de máquina,
ciência de dados,
codigo fluente,
codigo fonte,
como aprender a programar,
como aprender programação,
como ser um programador,
como utilizar a plataforma kaggle,
como utilizar o site kaggle,
curso de ciência de dados,
curso de ciência de dados com r,
curso de ciência de dados utilizando r,
curso de datascience,
curso de datascience com r,
curso de datascience utilizando r,
curso grátis,
curso grátis de ciência de dados,
curso grátis de ciência de dados com r,
curso grátis de ciência de dados utilizando r,
curso grátis de datascience,
curso grátis de datascience com r,
curso grátis de datascience utilizando r,
curso grátis de programação,
datascience utilizando R,
machine learning,
programacao em R,
quero aprender programação,
site kaggle,
tutorial de ciência de dados,
tutorial de data science,
tutorial de datascience,
tutorial de R,
tutorial para programar em R