R
A Ciência de Dados é a área de estudo dos dados desde seu processo de captura, transformação, análise e, posteriormente, da geração de informações e conhecimento para empresas, para o setor público e para os negócios.
Adpatado de Alfred Reinold Baudisch
Informações descontextualizadas não configuram o campo da Ciência de Dados, pois não geram conhecimento relevante.
Replicar códigos e análises de outras fontes não o faz um Cientista de Dados. É necessário dominar um conjunto de técnicas e ter conhecimento teórico do assunto.
É de fundamental importância a interação e a comunicação em equipe sobre os métodos e resultados para o desenvovimento da Ciência de Dados. É um campo multidisciplinar.
Este curso introduz as principais técnicas computacionais para a leitura, manipulação, visualização e reprodução de dados socioeconômicos.
Com o advento da tecnologia da informação e o rápido crescimento da quantidade de dados disponíveis, é indispensável o uso de ferramentas de Ciência de Dados para uma análise econômica robusta e eficiente.
O cronograma estimado de encontros está organizado da seguinte forma:
Ao longo da disciplina, serão disponibilizadas quizzes e listas de exercício.
A nota final (NF) na disciplina será atribuída de acordo com a seguinte função:
\[ \text{NF} = \text{Listas de Exercício} * 0.4 + \text{Avaliação Final}*0.6 \]
A OpenAI é a empresa que criou, no final de 2022, o ChatGPT.
Através dos dados da plataforma do http://insideairbnb.com é possível entender, por exemplo, o efeito sobre preço de imóveis.
Em Barcelona, por exemplo, o preço dos alugueis e de compra dos imóveis cresceram tanto em regiões mais concentradas quanto em menos concentradas.
Informações sobre o tempo da corrida https://movement.uber.com/ informam sobre o deslocamento da população nas cidades…
… e isso afeta saúde, produtividade, salários e o PIB dos municípios.
R
?The R Project for Statistical Computing
R
?R
é uma linguagem bastante popular…R
1. Acessar https://cran.r-project.org/ e clicar em 'download R'
.
R
2.Selecione o mirror (servidor onde o R
está disponível para download).
R
3. Selecionar o sistema operacional.
R
4. Selecione a opção para instalar o R
pela primeira vez
R
5. Selecione a versão mais recente e aguarde o download
R
no WindowsInterface do no Windows
R
é através de uma interface gráfica através de janelas.RStudio é um conjunto eficiente de ferramentas integradas https://posit.co/
Ambiente do RStudio
Além do RStudio, existem outras interfaces pra utilizar o R
:
Outra possibilidade é utilizar a versão on-line do RStudio, através do Posit Cloud
Faremos um tour pelo RStudio e mostraremos suas funcionalidades. Introduziremos os seguintes conceitos: