Essa análise tem como objetivo analisar os salários na base da RAIS. Esse projeto foi feito na semana Data Science na Prática da Curso-R.
Nesse relatório estamos interessados em responder a seguinte pergunta:
“Quanto ganha um cientista de dados?”
Para isso vamos utilizar a base da RAIS anonimizada.
Vamos utilizar o data lake da iniciativa Base dos Dados.
Abaixo está o bloco de código que carrega as primeiras 5 linhas da tabela de microdados.
ano | sigla_uf | id_municipio | tipo_vinculo | vinculo_ativo_3112 | tipo_admissao | mes_admissao | mes_desligamento | motivo_desligamento | causa_desligamento_1 | causa_desligamento_2 | causa_desligamento_3 | faixa_tempo_emprego | tempo_emprego | faixa_horas_contratadas | quantidade_horas_contratadas | id_municipio_trabalho | quantidade_dias_afastamento | indicador_cei_vinculado | indicador_trabalho_parcial | indicador_trabalho_intermitente | faixa_remuneracao_media_sm | valor_remuneracao_media_sm | valor_remuneracao_media | faixa_remuneracao_dezembro_sm | valor_remuneracao_dezembro_sm | valor_remuneracao_janeiro | valor_remuneracao_fevereiro | valor_remuneracao_marco | valor_remuneracao_abril | valor_remuneracao_maio | valor_remuneracao_junho | valor_remuneracao_julho | valor_remuneracao_agosto | valor_remuneracao_setembro | valor_remuneracao_outubro | valor_remuneracao_novembro | valor_remuneracao_dezembro | tipo_salario | valor_salario_contratual | subatividade_ibge | subsetor_ibge | cbo_1994 | cbo_2002 | cnae_1 | cnae_2 | cnae_2_subclasse | faixa_etaria | idade | grau_instrucao_1985_2005 | grau_instrucao_apos_2005 | nacionalidade | sexo | raca_cor | indicador_portador_deficiencia | tipo_deficiencia | ano_chegada_brasil | tamanho_estabelecimento | tipo_estabelecimento | natureza_juridica | indicador_simples | bairros_sp | distritos_sp | bairros_fortaleza | bairros_rj | regioes_administrativas_df |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1985 | AC | 1200054 | 1 | 1 | NA | NA | NA | NA | NA | NA | NA | 5 | 2.7 | NA | NA | NA | NA | NA | NA | NA | 3 | 2.13 | NA | 3 | 1.37 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 7013 | 24 | 31120 | NA | NA | NA | NA | 3 | NA | 5 | NA | 10 | 2 | NA | NA | NA | NA | 3 | 1 | NA | NA | NA | NA | NA | NA | NA |
1985 | AC | 1200054 | 1 | 1 | NA | NA | NA | NA | NA | NA | NA | 4 | 2.0 | NA | NA | NA | NA | NA | NA | NA | 3 | 2.77 | NA | 4 | 2.23 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 4510 | 18 | 39315 | NA | NA | NA | NA | 4 | NA | 6 | NA | 10 | 1 | NA | NA | NA | NA | 3 | 1 | NA | NA | NA | NA | NA | NA | NA |
1985 | AC | 1200054 | 1 | 1 | NA | NA | NA | NA | NA | NA | NA | 4 | 1.7 | NA | NA | NA | NA | NA | NA | NA | 5 | 4.41 | NA | 4 | 2.89 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 7013 | 24 | 63990 | NA | NA | NA | NA | 4 | NA | 9 | NA | 10 | 1 | NA | NA | NA | NA | 3 | 1 | NA | NA | NA | NA | NA | NA | NA |
1985 | AC | 1200054 | 1 | 1 | NA | 7 | NA | NA | NA | NA | NA | 2 | 0.5 | NA | NA | NA | NA | NA | NA | NA | 6 | 5.07 | NA | 4 | 2.82 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 7013 | 24 | 63990 | NA | NA | NA | NA | 3 | NA | 7 | NA | 10 | 1 | NA | NA | NA | NA | 3 | 1 | NA | NA | NA | NA | NA | NA | NA |
1985 | AC | 1200054 | 1 | 1 | NA | NA | NA | NA | NA | NA | NA | 4 | 1.3 | NA | NA | NA | NA | NA | NA | NA | 2 | 1.93 | NA | 3 | 1.20 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 4181 | 16 | 39190 | NA | NA | NA | NA | 5 | NA | 1 | NA | 10 | 1 | NA | NA | NA | NA | 2 | 1 | NA | NA | NA | NA | NA | NA | NA |