Repositório de exemplo para limpeza e tratamento de um pequeno conjunto de dados meteorológicos referentes a dias de jogos esportivos. Inclui um Jupyter Notebook (fvm_clima_tempo.ipynb) que explora, visualiza e sugere tratamentos para dados inconsistentes, ausentes e outliers.
fvm_clima_tempo.ipynb— Notebook Jupyter com análise exploratória, visualizações e procedimentos de limpeza/inspeção.tempo.csv— Conjunto de dados em CSV usado pelo notebook (formatado com;como separador).requirements.txt— Lista de dependências (atenção: o arquivo atualmente contém caracteres inválidos/encodificação estranha; veja seção de setup)..gitignore— Arquivos/dirs ignorados pelo Git (venv, pycache, .pyc).
Colunas:
- Aparencia — aparência do céu (valores esperados:
sol,nublado,chuva, etc.). - Temperatura — temperatura em °F.
- Umidade — umidade relativa em %.
- Vento — presença de vento (
VERDADEIRO/FALSO). - Jogar — decisão (sim/nao).
Problemas observados (detectados no notebook)
- Valores ausentes:
- Umidade: 1 valor ausente
- Vento: 1 valor ausente (célula vazia)
- Valores inválidos / inconsistentes:
- Em
Aparenciaexiste o valor"menos"(provável erro de digitação). - Em
Ventoos valores são strings em português (VERDADEIRO,FALSO) — convém converter para boolean. - Em
Jogarvaloressim/nao— convém mapear para boolean ou 1/0.
- Em
- Outliers numéricos:
Temperaturacontém1220— muito acima do razoável (provável erro de entrada).Umidadecontém200— acima de 100% (provável erro).
Recomenda-se Python 3.8+ e um ambiente virtual.
-
Criar e ativar venv:
- Linux/macOS:
python3 -m venv .venv source .venv/bin/activate - Windows (PowerShell):
python -m venv .venv .\.venv\Scripts\Activate.ps1
- Linux/macOS:
-
Corrigir / instalar dependências:
- Atenção: se
requirements.txtapresentar erro de codificação, abra o arquivo e salve com codificação UTF-8 sem bytes nulos/BOM. - Dependências relevantes encontradas no repositório (versões propostas):
- pandas==2.3.3
- seaborn==0.13.2
- voila==0.5.11
- Instalar:
pip install pandas==2.3.3 seaborn==0.13.2 voila==0.5.11 # ou, após corrigir requirements.txt pip install -r requirements.txt
- Atenção: se
-
Executar o notebook:
jupyter notebook fvm_clima_tempo.ipynb # ou utilze o voila voila fvm_clima_tempo.ipynbOu usar JupyterLab / Google Colab (suba o notebook e o CSV).
Pull requests são bem-vindos. Para contribuições:
- Abra uma branch com mudanças.
- Corrija o
requirements.txtse necessário (salve em UTF-8). - Inclua testes simples ou explique a lógica de limpeza aplicada.
Criador do repositório: cllmenate (GitHub)
MIT License.