diff --git a/modulos-cientificos b/modulos-cientificos new file mode 100644 index 0000000..df2d568 --- /dev/null +++ b/modulos-cientificos @@ -0,0 +1,61 @@ +# Módulos Científicos em Python + +## 1. Análise e Manipulação de Dados + +- **NumPy**: Biblioteca fundamental para computação científica em Python, fornece suporte para arrays e matrizes multidimensionais, além de uma grande coleção de funções matemáticas de alto desempenho. +- **Pandas**: Ferramenta para análise e manipulação de dados, especialmente útil para trabalhar com tabelas de dados estruturados, fornecendo estruturas de dados como DataFrames. +- **SciPy**: Biblioteca de computação científica que complementa o NumPy, oferecendo ferramentas para otimização, integração, interpolação, álgebra linear, estatísticas e muito mais. +- **Dask**: Extensão do NumPy e Pandas para computação distribuída e paralela, permite processamento de grandes conjuntos de dados que não cabem na memória. +- **Xarray**: Biblioteca para trabalhar com dados multidimensionais rotulados, como dados climáticos, dados espaciais e outros dados científicos. + +## 2. Visualização de Dados + +- **Matplotlib**: Biblioteca padrão para criação de gráficos e visualização de dados em Python, amplamente usada em ciência de dados e pesquisa científica. +- **Seaborn**: Biblioteca baseada no Matplotlib, voltada para visualização de dados estatísticos, com gráficos pré-configurados para fácil análise e interpretação. +- **Plotly**: Ferramenta para criar gráficos interativos e visualizações em 3D, muito usada para visualizações científicas complexas. +- **Bokeh**: Biblioteca para visualização de dados interativa e web, permite a criação de gráficos dinâmicos e dashboards científicos. +- **Pygal**: Biblioteca para criar gráficos SVG, ideal para visualizações leves e escaláveis para a web. + +## 3. Machine Learning e Inteligência Artificial + +- **scikit-learn**: Ferramenta essencial para aprendizado de máquina, fornece uma ampla gama de algoritmos de classificação, regressão e clustering, além de funções de pré-processamento. +- **TensorFlow**: Framework de aprendizado profundo criado pelo Google, utilizado para construir e treinar redes neurais complexas. +- **PyTorch**: Biblioteca de aprendizado profundo desenvolvida pelo Facebook, amplamente usada para pesquisa e desenvolvimento em redes neurais e aprendizado de máquina. +- **Keras**: API de alto nível para redes neurais que roda sobre TensorFlow, fácil de usar e popular para prototipagem rápida de modelos de aprendizado profundo. +- **Statsmodels**: Biblioteca para análise estatística e econometria, útil para modelagem estatística avançada e testes de hipóteses. + +## 4. Processamento de Sinais e Imagem + +- **OpenCV**: Biblioteca para processamento de imagens e visão computacional, utilizada para manipulação de imagens, vídeos e visão computacional em geral. +- **scikit-image**: Biblioteca para processamento de imagens com uma variedade de algoritmos de análise e manipulação. +- **imageio**: Biblioteca para leitura e gravação de uma ampla gama de formatos de imagens, além de manipulação de vídeos. +- **PyWavelets**: Biblioteca para análise de wavelets, utilizada no processamento de sinais, compressão de dados e remoção de ruído. +- **Soundfile**: Ferramenta para manipulação de ficheiros de áudio, útil para análise de sinais de som. + +## 5. Estatística e Probabilidade + +- **SymPy**: Biblioteca para matemática simbólica, oferece ferramentas para manipulação e resolução de expressões algébricas, cálculo simbólico e operações matemáticas avançadas. +- **Statsmodels**: Voltada para análise estatística, inclui ferramentas para modelagem e testes estatísticos, análise de séries temporais e econometria. +- **PyMC3**: Biblioteca para modelagem probabilística bayesiana, utilizada em modelos estatísticos complexos e inferência bayesiana. +- **scipy.stats**: Submódulo do SciPy dedicado a funções estatísticas e distribuições de probabilidade, útil para realizar testes estatísticos e análise de dados. + +## 6. Processamento de Texto e NLP (Processamento de Linguagem Natural) + +- **NLTK**: Biblioteca para processamento de linguagem natural, oferece ferramentas para análise de texto, tokenização, stemming, lematização e análise sintática. +- **spaCy**: Biblioteca avançada para processamento de linguagem natural, muito rápida e eficiente, com funcionalidades de análise de dependência, NER (Reconhecimento de Entidades Nomeadas) e vetorização de texto. +- **Gensim**: Biblioteca para modelagem de tópicos, transformação de textos e análise semântica, amplamente utilizada para análise de documentos e construção de modelos de tópicos. +- **TextBlob**: Biblioteca para tarefas básicas de NLP, incluindo análise de sentimentos, classificação de texto e extração de recursos. + +## 7. Computação Paralela e Distribuída + +- **Dask**: Permite a execução de computação distribuída e paralela, útil para processar grandes quantidades de dados. +- **Joblib**: Biblioteca para paralelização em tarefas de ciência de dados, usada para execução eficiente de loops e pipelines paralelizados. +- **Ray**: Plataforma para desenvolvimento de aplicações distribuídas, ideal para trabalhos em machine learning e processamento de dados de larga escala. + +## 8. Outros Módulos Científicos + +- **Biopython**: Conjunto de ferramentas para bioinformática, oferece funções para análise de sequências biológicas, manipulação de ficheiros e estruturas moleculares. +- **Astropy**: Biblioteca para astronomia, com ferramentas para análise de dados astronômicos, manipulação de coordenadas e simulação de fenômenos espaciais. +- **geopandas**: Extensão do Pandas para análise de dados geoespaciais, permite manipulação de dados geográficos e realização de análises espaciais. +- **ChemPy**: Biblioteca para química computacional, oferece funcionalidades para simulação de reações químicas, cinética e análise de equilíbrio químico. +- **Pint**: Módulo para manipulação de unidades físicas, permitindo realizar cálculos com unidades de medida.