Aula 07 – Data Science – R – Caso do Titanic – Kaggle

Curso de Data Science

Aula 07 – Data Science – R – Caso do Titanic – Kaggle

kaggle - Caso do Titanic - Data Science

Caso do Titanic – Kaggle

Continuando com o problema do Titanic proposto pelo Kaggle.

Já limpamos os campos Embarked e Age, agora vamos limpar o campo Fare.

Verificação agora do campo Fare (tarifa):

table(is.na(titanic.full$Fare))

Saída:

FALSE  TRUE

1308     1

Ou seja, 1 registro não tem essa informação.

Vamos preencher o registro que falta essa informação com a mediana das tarifas.

#Pega a mediana das tarifas do conjunto total (titanic.full) desconsiderando

#os registros sem essa informação e atribuindo a variável fare.median

fare.median <- median(titanic.full$Fare, na.rm = TRUE)

#preenche os registros sem a informação de Fare com a mediana

titanic.full[is.na(titanic.full$Fare), “Fare"] <- fare.median

Rodando novamente:

table(is.na(titanic.full$Fare))

Saída:

FALSE

1309

Agora todos os registros tem a informação Fare.

Obrigado, até mais.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *