Formação em Inteligência Artificial
Do zero absoluto ao especialista em agentes — o currículo mais completo do mercado brasileiro, estruturado em 3 etapas progressivas.
// mapa mental fundamental
Antes de iniciar qualquer módulo, internalize este mapa. Tudo que você vai estudar se encaixa aqui. Saber onde cada empresa e tecnologia está nessa pilha é a diferença entre um usuário e um especialista.
// camadas 1–7: barreira de bilhões · camadas 8–10: onde você cria valor real
// visão geral do programa
Etapa 1
Fundamentos & Cenário Global
Etapa 2
IA na Prática
Etapa 3
Técnico Avançado
Bem-vindo à FIA — Visão geral e como usar este cronograma no Claude Pro
Método de estudo, ritmo semanal, como pedir aprofundamento de cada aula. Como estruturar seus arquivos de notas.
IA não é robô — mitos, ficção científica e a realidade dos sistemas atuais
O que IA é e o que não é. Por que o hype distorce a percepção. Terminator vs. ChatGPT. O perigo de tomar decisões baseadas em narrativas erradas.
A hierarquia conceitual — IA → Machine Learning → Deep Learning → LLMs
O guarda-chuva conceitual correto. Onde cada termo se encaixa. Diagrama mental que você vai usar para sempre ao ler notícias e artigos.
Narrow AI vs. AGI vs. ASI — a distinção que a mídia sempre confunde
O que existe hoje (Narrow AI). O que pode existir em anos (AGI). O que é teórico (ASI). Por que essa distinção importa para negócios e carreiras.
Como a IA aprende — treinamento vs. inferência
A distinção mais importante para quem vai trabalhar com IA. Treinamento: bilhões de dólares, semanas. Inferência: centavos, milissegundos. Impacto no modelo de negócio.
Anatomia de um LLM — Tokens, Embeddings e Context Window explicados
O que é um token e por que você paga por ele. Embeddings como coordenadas no espaço semântico. Context window como memória de trabalho. Implicações práticas.
Prompt Engineering, RAG e Fine-tuning — quando usar cada abordagem
As três formas de adaptar IA ao seu caso de uso. Custo, prazo e quando cada abordagem faz sentido. O erro mais caro: usar fine-tuning quando RAG bastaria.
Glossário completo — os 60 termos que você precisa dominar
GPU, TPU, token, embedding, hallucination, fine-tuning, RAG, agent, multimodal, benchmark, context window, temperatura, grounding, RLHF, constitutional AI e mais.
1956–1980 · IA Simbólica — o sonho das regras lógicas e por que falhou
A Conferência de Dartmouth (1956). John McCarthy cunha o termo "Artificial Intelligence". Sistemas SE→ENTÃO. Por que o mundo real não cabe em regras explícitas.
1980–2000 · Sistemas Especialistas e o 1º Inverno da IA
Sistemas especialistas em medicina e finanças. O colapso dos anos 80. Lição permanente: hype precede decepção. O padrão Gartner Hype Cycle aplicado à IA.
2000–2012 · Machine Learning Clássico — SVM, Random Forest e o poder dos dados
Algoritmos que aprendem sem regras explícitas. O surgimento do Big Data. Netflix Prize. Por que funcionou onde a IA simbólica falhou: dados, não regras.
2012 — AlexNet e a Revolução do Deep Learning
ImageNet 2012. Alex Krizhevsky e Geoffrey Hinton. Como uma competição de imagens mudou o mundo para sempre. A era das redes neurais profundas começa.
2017 — "Attention Is All You Need" e o nascimento dos Transformers
O paper mais importante da história da IA moderna. Google Brain. Por que o mecanismo de atenção mudou tudo. GPT, BERT e toda a IA generativa vêm daqui.
2022–2025 — ChatGPT, a explosão e o choque do DeepSeek
Nov/2022: 1 milhão de usuários em 5 dias. Bing, Bard, Claude entram na corrida. Jan/2025: DeepSeek R1 rivaliza GPT-4o com custo 15x menor — e apaga US$600B da NVDA.
Os Personagens — Turing, McCarthy, Hinton, LeCun, Altman, Amodei, Huang
Quem são os "pais" da IA. A saída dramática de Hinton do Google em 2023. A ruptura da OpenAI que criou a Anthropic. Jensen Huang e o monopólio de chips.
NVIDIA — o monopólio acidental e por que CUDA é o maior moat de software da história
Fundada para games em 1993. CUDA lançado em 2006. 18 anos de vantagem que AMD e Intel não conseguem replicar. H100: US$30–40k/unidade. Market cap US$3+ trilhões.
TSMC — a empresa mais estratégica do planeta e o risco geopolítico de Taiwan
92% dos chips avançados do mundo saem de uma ilha a 160km da China. O "Silicon Shield". Por que o colapso da TSMC pararia a economia global em semanas.
OpenAI, Anthropic, Google DeepMind, Meta AI, xAI — estratégias e valuations
OpenAI US$157B. Anthropic US$61B com AWS + Google. xAI US$24B. Por que cada empresa tem uma estratégia radicalmente diferente de segurança e monetização.
AWS, Azure, Google Cloud — a batalha das nuvens e quem está ganhando em IA
AWS 32%, Azure 25%, GCP 11% de market share. Parcerias exclusivas: AWS↔Anthropic, Azure↔OpenAI. Como as clouds monetizam IA via Bedrock, Azure AI Studio, Vertex.
Como o dinheiro circula no ecossistema de IA — o fluxo real de bilhões
Da API ao token ao usuário final. Como OpenAI cobra, como AWS revende, como startups faturam em cima. O modelo econômico completo da IA em 2026.
Bolsa de valores e IA — NVDA, MSFT, GOOGL, AMD e os ETFs do setor
Como investir no setor (sem recomendação). O "NVDA efeito". ETFs: BOTZ, AIQ, ARKQ. O efeito DeepSeek de US$600B apagados da NVDA em um único pregão.
Venture Capital e IA — a16z, Sequoia, Y Combinator e onde estão os bilhões
US$67B investidos em startups de IA em 2023. US$100B+ em 2024. Como VCs escolhem apostas. As teses de investimento de a16z e Sequoia para 2025/2026.
Concentração de valor — por que 5 empresas dominam e onde estão as oportunidades
5 empresas = US$10+ trilhões em market cap. Retornos crescentes de escala. O efeito flywheel. Onde empreendedores e especialistas podem entrar e criar valor real.
Brasil no ecossistema global de IA — posição atual, oportunidades e riscos
Mercado brasileiro de IA. Empresas nacionais: Stefanini, Aquarela, Neoway. BNDES e políticas de fomento. Onde o Brasil pode competir e onde já está perdendo.
A corrida global da IA — EUA, China, Europa, Índia e o resto do mundo
Investimentos governamentais por país. Estratégias nacionais de IA. Quem está na frente em pesquisa, em aplicação e em regulação. O risco de ficar para trás.
Export Controls — o bloqueio de chips para a China e a corrida de contornos
Timeline: out/2022, out/2023, jan/2024. A100, H100, H800 banidos. Huawei Ascend 910B como resposta. Como a China está construindo uma stack independente.
O Choque DeepSeek — o que realmente aconteceu em janeiro de 2025
DeepSeek R1: rivalizou GPT-4o com US$6M de custo vs US$100M+. Open-source e gratuito. Apagou US$600B da NVIDIA. As 4 lições que todo especialista tirou do evento.
CHIPS Act e a reindustrialização americana de semicondutores
US$52B em subsídios. Intel, TSMC e Samsung construindo fábricas nos EUA. Por que está demorando mais que o previsto. O problema da mão de obra especializada.
ASML — o monopólio das máquinas de litografia EUV que ninguém fala
A empresa holandesa que fabrica as únicas máquinas que produzem chips abaixo de 7nm. Sem ASML, sem chips avançados. Por que é a peça invisível da guerra geopolítica.
EU AI Act (2024) — a primeira regulação abrangente de IA do mundo
Aprovado em agosto de 2024. Sistema de risco: mínimo, limitado, alto, inaceitável. O que é proibido. Obrigações para sistemas de alto risco. Impacto para empresas globais.
IA e guerra — drones autônomos, sistemas de armas, ciberguerra e desinformação
IA no campo de batalha: Ucrânia, Gaza, conflitos futuros. LAWS (Lethal Autonomous Weapons). Ciberataques com IA. Deepfakes em conflitos geopolíticos. O debate ético.
Marco Legal da IA no Brasil — PL 2338/2023 e o que muda para empresas
Status atual no Senado. Categorias de risco. Obrigações para quem usa IA. Como LGPD e o PL de IA interagem. O que fazer agora para se preparar.
| Ano | Demissões Tech | Atrib. à IA | Contexto |
|---|---|---|---|
| 2022 | 164.709 | — | Correção pós-pandemia |
| 2023 | 260.000 | ~12.000 | Reajuste geral + início do hype IA |
| 2024 | 190.000 | ~31.000 | Intel, Amazon, Google, Microsoft |
| 2025 | 244.851 | ~69.000 | Intel -33,9k · Amazon -19,5k · MS -20k |
| 2026 (proj.) | ~200.000 | crescente | Automação de funções inteiras de suporte |
Dados reais sobre demissões atribuídas à IA — 2022 a 2026
Layoffs.fyi, Challenger Gray & Christmas, KPMG, WEF. Como separar demissões por IA de demissões por correção econômica. Casos no Brasil: Nubank, iFood, bancos.
O framework correto — automação de tarefas, não de profissões
A pergunta certa: "quais tarefas de X a IA faz melhor?" O caso Klarna: anúncio vs. realidade. Por que jornalistas erram ao cobrir automação. Como pensar corretamente.
Profissões em alto risco e profissões em ascensão
Alto risco: entrada de dados, SAC nível 1, tradução simples, revisão de contratos simples. Alto potencial: AI Engineer, AI Solutions Architect, AI Product Manager, Prompt Engineer.
Mapa por profissão — medicina, direito, contabilidade, engenharia, marketing, educação
Para cada área: o que a IA já faz, o que permanece humano, o nível de risco (1–5) e as ferramentas reais sendo usadas em 2026 no Brasil e no mundo.
A profissão que não existia — AI Solutions Architect
O que é. O que faz. Salário médio (US$160–250k EUA; R$15–25k/mês SP senior). Empresas que contratam. Como construir esse perfil saindo do zero ao longo desta formação.
O que Goldman, McKinsey e MIT dizem — os maiores estudos de 2024–2026
Goldman Sachs: 300M empregos afetados globalmente. McKinsey: 60–70% das atividades automatizáveis. Stanford AI Index 2025. WEF Future of Jobs 2025. Leitura crítica.
Como se posicionar no mercado de IA — estratégia pessoal e de negócio
Regra de ouro: profissionais com IA substituem profissionais sem IA. Como construir seu diferencial ao longo desta formação. Portfólio, especialização vertical, comunidade.
Os três paradigmas de aprendizado — supervisionado, não-supervisionado e por reforço
Onde cada um se aplica com exemplos reais. Por que a maioria dos produtos usa supervisionado mas o AlphaGo usou reforço. RLHF: como os LLMs são alinhados.
Redes Neurais — neurônios, camadas, funções de ativação e backpropagation
Como funciona conceitualmente sem matemática pesada. Por que camadas profundas são mais poderosas. O conceito de peso, gradiente e otimização. Visualizações interativas.
CNNs — Redes Convolucionais e como a IA "vê" o mundo
Filtros e feature maps. Pooling. Por que CNNs são ideais para imagens. Aplicações reais: reconhecimento facial, diagnóstico médico por imagem, carros autônomos, qualidade industrial.
RNNs e LSTMs — sequências temporais, memória e onde ainda importam em 2026
Por que RNNs foram criadas. O problema de memória de longo prazo e como LSTMs resolvem. Onde ainda se usam: séries temporais financeiras, IoT, sinais biomédicos.
A arquitetura Transformer — Atenção, Encoder, Decoder e o que faz um LLM
Self-attention mecanismo central. Multi-head attention. Positional encoding. Encoder-only (BERT) vs. Decoder-only (GPT). O que faz um LLM ser "grande". Scaling laws.
Modelos Multimodais — texto + imagem + áudio + vídeo numa única IA
GPT-4o, Gemini 1.5 Pro, Claude 3.5 Sonnet. Como a IA processa diferentes modalidades. A corrida pelo modelo "omni". Implicações para produtos e interfaces.
Modelos de Difusão — como Midjourney, DALL-E e Stable Diffusion geram imagens
Difusão reversa: ruído → imagem. Latent Diffusion Models (LDMs). Como o modelo mapeia texto a espaço visual. LoRAs e customização de estilos. O papel do CLIP.
Benchmarks — como comparar modelos (MMLU, HumanEval, LMSYS Arena, Artificial Analysis)
O que mede cada benchmark. Por que benchmarks podem ser enganosos (data contamination). LMSYS Chatbot Arena como avaliação humana real. Como escolher o modelo certo para cada problema.
Modelos de texto (LLMs) — GPT-4o, Claude, Gemini, Llama, DeepSeek, Mistral em 2026
Pontos fortes de cada modelo. Closed-source vs. open-source. Modelos de raciocínio (o1, o3, Claude Opus). Como o mercado está se fragmentando por caso de uso.
Modelos de imagem — Midjourney v7, DALL-E 3, Stable Diffusion XL, Flux, Adobe Firefly
Qualidade, custo, licenciamento e uso comercial de cada um. Qual usar para produto vs. marketing vs. arte. Como workflows de criação estão mudando com IA.
Modelos de vídeo — Sora, Veo 3, Runway Gen-4, Kling, Pika — o estado em 2026
A fronteira mais difícil da IA generativa. Coerência temporal. O que já funciona para produção comercial. Casos de uso reais em marketing e entretenimento.
Modelos de áudio e voz — ElevenLabs, Whisper, Suno, Udio, NotebookLM
TTS (texto para voz), STT (voz para texto), clonagem de voz, geração de música. Casos de uso reais em produtos, podcasts, atendimento ao cliente e marketing.
IA para código — Cursor, GitHub Copilot, Claude Code, Devin, v0 e o vibe coding
Como a IA está transformando o desenvolvimento. 55% mais rápido com Copilot (Microsoft). O que é "vibe coding". Quando IA não substitui o programador sênior.
Modelos locais vs. cloud — Ollama, LM Studio, Llama.cpp e quando rodar IA offline
Por que rodar modelos localmente. Privacidade de dados sensíveis. Latência e custo zero por chamada. Hardware necessário. Modelos que cabem em notebooks de 16GB.
Como ficar atualizado — fontes, newsletters, comunidades e o ritmo de atualização
O ecossistema muda toda semana. As 12 fontes essenciais: Hugging Face, @karpathy, Stratechery, The Rundown AI, TLDR AI, Papers with Code, Simon Willison e mais.
IA no smartphone — Apple Intelligence, Gemini integrado e assistentes nativos em 2026
Onde a IA está escondida no seu telefone. NPUs (Neural Processing Units) e processamento on-device. A batalha dos assistentes móveis. O que vem nos próximos 12 meses.
IA na busca — Perplexity, Google AI Overview, SearchGPT e o fim do SEO tradicional
Como a IA está matando cliques orgânicos. O que é um "Answer Engine". Como o comportamento de busca está mudando. O impacto catastrófico para criadores de conteúdo baseados em SEO.
IA na criatividade — workflows práticos para imagens, música, vídeos e texto
Workflows reais para criadores. Prompts que funcionam em Midjourney, Suno e Claude. Como IA amplifica criatividade humana. O debate sobre direitos autorais e atribuição.
IA para aprender — NotebookLM, Khanmigo, tutores de IA e o método de estudo com Claude
Como usar IA para estudar mais rápido e reter mais. O método de Feynman com IA. Riscos do uso passivo (dependência cognitiva). Como criar ativamente com IA.
IA em casa — smart devices, automação residencial, wearables e saúde pessoal
Alexa, Google Home, Apple HomeKit com IA. Wearables: Apple Watch ECG, Oura Ring. Apps de saúde mental (Woebot, Spring Health). A casa como plataforma de dados pessoais.
IA nas redes sociais — algoritmos de recomendação, feed e o risco da bolha algorítmica
Como TikTok, Instagram e YouTube usam IA para maximizar engajamento. Deepfakes nas redes. Bolhas algorítmicas e polarização. Regulação emergente de plataformas.
Onde está o ROI real — o que funciona, o que é hype e como medir
Framework: custo de API + implementação vs. horas economizadas × custo/hora. Os casos com ROI comprovado (código, SAC, geração de conteúdo) vs. os que costumam falhar.
IA em vendas — SDR automatizado, qualificação BANT, personalização e análise de calls
Clay, Apollo, 11x.ai, Gong. Pipeline completo: geração de leads → enriquecimento → qualificação → personalização → análise de calls → previsão de receita com IA.
IA em marketing — copy, imagens, vídeos, campanhas e personalização em escala
Jasper, Copy.ai, Canva AI, HeyGen. Workflows de conteúdo com IA. A campanha Heinz com DALL-E. Como marcas estão usando IA de verdade (e como estão errando).
IA em atendimento — chatbots, triagem, escalonamento e o caso real da Klarna
O que o bot faz bem (FAQ, nível 1, triagem). O que humanos ainda fazem melhor. Klarna: 700 agentes, US$40M/ano economizados — e a decisão de recontratar humanos depois.
IA em RH — recrutamento, triagem de currículos, onboarding e engajamento
HireVue, LinkedIn AI Recruiter. Riscos de viés algorítmico em triagem (EEOC Guidelines). Cases: Unilever cortou 70% do tempo de triagem. O que a LGPD diz sobre decisões automatizadas de RH.
IA em finanças — detecção de fraude, auditoria, relatórios e análise de contratos
JPMorgan COIN: lê contratos de 360k horas em segundos. KPMG Clara. Deloitte Omnia. Detecção de fraude em tempo real. 40% das tarefas de auditoria automatizáveis em 2025.
IA em saúde — diagnóstico por imagem, AlphaFold e os 700+ dispositivos aprovados pela FDA
Aidoc, PathAI, Viz.ai. Google DeepMind e detecção de câncer de mama. AlphaFold 3 e a revolução em biologia molecular. O que a ANVISA está fazendo no Brasil.
IA em direito e advocacia — Harvey AI, Jusbrasil IA e revisão automática de contratos
Dentons: contratos 90% mais rápido. Pinheiro Neto implementou Harvey AI em 2024. O que não se automatiza: estratégia, negociação, ética, relação com o cliente.
Como construir um caso de IA para sua empresa — do problema ao ROI aprovado
Framework passo a passo: identificar problema real → mapear dados disponíveis → escolher abordagem → estimar custo → projetar ROI → estruturar apresentação para executivos.
A economia dos tokens — como OpenAI, Anthropic e Google monetizam seus modelos
Preço por token input/output. GPT-4o: US$5/1M tokens in, US$15/1M tokens out. Como calcular custo de APIs em produtos reais. O modelo de negócio das AI labs.
NVIDIA na bolsa — por que uma empresa de chips vale mais que países inteiros
Do gaming ao AI. Margens brutas de 75%+. H100, H200, B100. A tese do monopólio de hardware. Por que o mercado acredita que essa vantagem dura — e os riscos reais.
O efeito DeepSeek no mercado — quando US$600B sumiram em um único pregão
27 jan 2025. DeepSeek R1 open-source. NVIDIA caiu 17% em um dia. O que o mercado aprendeu. Por que NVDA se recuperou. O que muda para o setor de chips no longo prazo.
Rodadas de investimento e valuations — como as AI labs valem o que valem
OpenAI US$157B, Series E. Anthropic US$61B com AWS + Google. xAI US$24B. Como VCs valoram empresas de IA pré-lucrativas. O risco de bolha e os argumentos contra.
ETFs e como o investidor acessa o setor de IA
BOTZ, AIQ, ARKQ, IETC. Exposição direta (NVDA, MSFT) vs. indireta (ETFs). Riscos específicos do setor. Como pensar em IA como classe de ativo emergente.
Retornos crescentes de escala — por que a concentração em IA é estrutural
O flywheel: mais usuários → mais dados → modelo melhor → mais usuários. Por que é difícil quebrar esse ciclo. A analogia com Standard Oil. Onde empreendedores podem entrar.
Energia e data centers — o gargalo de US$1 trilhão que define quem lidera a IA
Microsoft reabriu Three Mile Island para data centers de IA. Um cluster de hiperescala = cidade pequena em consumo. NVDA + energy = o novo petróleo. Oportunidades no Brasil.
Alucinações — por que a IA inventa fatos e como mitigar no design de sistemas
O que causa alucinações. Por que o modelo não "sabe que não sabe". Técnicas de mitigação: grounding, RAG, verificação de fontes, citações obrigatórias.
Viés algorítmico — como o preconceito entra nos dados e sai nos modelos
Cases reais: reconhecimento facial em pessoas negras, viés de gênero em contratação, discriminação em crédito. Como detectar e medir viés. Fairness metrics. Responsabilidade legal.
EU AI Act (2024) — o guia prático para quem vai construir soluções
4 níveis de risco. O que é proibido (manipulação subconsciente, score social). Obrigações para sistemas de alto risco (saúde, crédito, RH). Como se preparar em 2026.
LGPD e IA — dados pessoais, consentimento, bases legais e decisões automatizadas
Como a LGPD se aplica a sistemas de IA. Dados de treinamento e privacidade. Art. 20 LGPD: direito à revisão humana de decisões automatizadas. O papel do DPO em projetos de IA.
Deepfakes, desinformação e a crise de confiança digital
Como detectar deepfakes. Ferramentas de autenticidade: C2PA, Adobe Content Credentials. Impacto nas eleições de 2024. O que plataformas estão (e não estão) fazendo.
AI Safety e Alinhamento — por que Anthropic existe e o que é "Constitutional AI"
O problema de alinhamento. Por que é difícil garantir que IA faça o que queremos. Constitutional AI da Anthropic. RLHF. A diferença entre AI Safety e cibersegurança convencional.
Direitos autorais e IA — quem é dono do que a IA cria?
O debate legal global. Cases: Getty vs. Stability AI, The New York Times vs. OpenAI. O que o USCO diz sobre autoria de IA. Como sua empresa pode usar conteúdo gerado por IA.
Construindo IA responsável — checklist para projetos éticos e conformes
Framework completo: avaliação de impacto → testes de viés → monitoramento contínuo → explainability → human-in-the-loop → documentação. O que incluir em qualquer projeto de IA.
Ambiente de desenvolvimento — Python, pip, venv, VS Code, Jupyter e .env
Instalação correta no Windows/Mac/Linux. Virtual environments (por que são obrigatórios). Jupyter vs. scripts .py. VS Code com extensões de IA. Gerenciar segredos com dotenv.
Python básico — variáveis, tipos, funções, loops, condicionais e exceções
Strings, listas, dicionários, sets, tuplas. Funções com *args e **kwargs. Try/except/finally. F-strings e formatação. Tudo que aparece em qualquer código de LLM real.
Python intermediário — classes, módulos, decorators, generators e type hints
POO para IA: herança, composição, dataclasses. Decorators (@property, @staticmethod). Generators e lazy evaluation. Type hints com typing. Context managers (with).
NumPy — arrays multidimensionais, broadcasting e operações matriciais
ndarray vs. lista Python. Broadcasting. Slicing avançado. Álgebra linear: np.dot, np.linalg. Por que é 100x mais rápido. Como embeddings são representados como arrays NumPy.
Pandas — carregamento, limpeza, transformação e análise de dados estruturados
DataFrame e Series. Leitura de CSV, JSON, Parquet, Excel. Filtragem, agrupamento, merge, pivot. Limpeza de dados sujos. Preparar datasets para fine-tuning e RAG.
APIs com Python — requests, httpx, OAuth e consumo de APIs de IA
REST APIs: GET, POST, headers, payloads, status codes. Bearer tokens e API keys. Rate limiting e retry logic. Consumir OpenAI, Anthropic, Google APIs. Streaming com httpx.
Async Python — asyncio, await, coroutines e paralelismo em agentes
Diferença síncrono vs assíncrono. Event loop. async/await. asyncio.gather() para chamadas paralelas de LLM. aiohttp. Por que agentes precisam de código assíncrono para escalar.
Git e GitHub — versionamento, branches, .gitignore e estrutura de repositório de IA
Comandos essenciais: init, add, commit, push, pull, branch, merge. .gitignore correto para IA (nunca commitar .env!). GitHub Actions básico. Estrutura padrão de repositório.
Matemática essencial para IA — álgebra linear, probabilidade e estatística aplicada
Vetores, matrizes, produto escalar e matricial. Distribuições de probabilidade. Teorema de Bayes. Gradiente e derivada intuitiva. Tudo que aparece em papers de IA.
Scikit-learn — o pipeline padrão de ML: dados → features → modelo → avaliação
train_test_split, StandardScaler, Pipeline, ColumnTransformer, cross_val_score, GridSearchCV. O workflow correto que evita vazamento de dados (data leakage).
Regressão e Classificação — LinearReg, LogisticReg, KNN, SVM, Naive Bayes
Quando usar cada algoritmo. Overfitting vs. underfitting. Regularização L1 (Lasso) e L2 (Ridge). Projeto prático: classificador de sentimento em reviews de produtos BR.
Árvores, Random Forest, XGBoost e Gradient Boosting — o rei dos dados tabulares
O algoritmo mais vencedor em competições de dados. Feature importance. XGBoost vs. LightGBM vs. CatBoost. Por que bate redes neurais em dados tabulares estruturados.
Clustering e Redução de Dimensionalidade — K-Means, DBSCAN, PCA, UMAP, t-SNE
Aprendizado não-supervisionado. Segmentação de clientes. PCA para redução de ruído. UMAP para visualização de embeddings de LLMs. Encontrar padrões em dados não rotulados.
Métricas de avaliação — Accuracy, Precision, Recall, F1, AUC-ROC, RMSE, MAE
Por que accuracy sozinha mente. Matriz de confusão. Quando priorizar Precision vs. Recall (ex: detecção de fraude). Como reportar resultados de forma honesta e comparável.
PyTorch — tensores, autograd e o grafo computacional dinâmico
torch.Tensor vs numpy. requires_grad=True. .backward() e como o gradiente flui. GPU com .to('cuda') e .to('mps'). torch.no_grad() para inferência eficiente.
Construindo redes neurais — nn.Module, camadas, ativações e o loop de treino
nn.Linear, nn.ReLU, nn.BatchNorm1d, nn.Dropout, nn.Sequential. Forward pass customizado. Loss functions. Optimizers (Adam, AdamW, SGD). O loop treino/validação correto.
CNNs na prática — classificação de imagens com torchvision e DataLoaders
Conv2D, MaxPool2D, BatchNorm2D. ResNet, VGG, EfficientNet via torchvision.models. Dataset e DataLoader customizados. Projeto: classificador de produto com 95%+ accuracy.
Transfer Learning e Fine-tuning com HuggingFace — modelos pré-treinados na prática
Por que treinar do zero é desperdício. Feature extraction vs. full fine-tuning. HuggingFace Hub e AutoModel. Tokenizers. Projeto: classificador de sentimento em PT-BR com BERT.
A arquitetura Transformer implementada do zero com PyTorch
Self-attention com Q, K, V. Multi-head attention. Positional encoding sinusoidal. Layer norm. Feed-forward sublayer. Construir um mini-GPT do zero seguindo o paper original.
Técnicas avançadas — LR schedulers, gradient clipping, mixed precision, checkpointing
OneCycleLR, CosineAnnealingLR. Gradient clipping para estabilidade. torch.cuda.amp para treino FP16 (2x mais rápido). Salvar e retomar checkpoints. Weights & Biases para tracking.
APIs de LLMs — OpenAI, Anthropic, Google, Groq, Together.ai, Ollama local
Estrutura de request: system/user/assistant. Streaming com event-driven responses. Parâmetros: temperature, top_p, max_tokens, stop. Comparação de latência e custo real entre providers.
Prompt Engineering avançado — CoT, Few-Shot, XML tags, System prompts e JSON mode
Chain-of-Thought e seu impacto em raciocínio complexo. Few-shot com exemplos ótimos. Role prompting. XML tags para estrutura (Claude). JSON mode e Structured Outputs (OpenAI/Anthropic).
Embeddings — criação, similaridade cosseno, busca semântica e casos de uso
text-embedding-3-small (OpenAI), embed-multilingual-v3 (Cohere). numpy para similaridade cosseno. Encontrar documentos similares. Clustering semântico de tickets de suporte. Projeto real.
Vector Databases — Chroma, Pinecone, Qdrant, Weaviate e pgvector
O que é e por que precisa de banco vetorial. HNSW index. Filtros de metadados. Quando usar Chroma (local/dev) vs. Pinecone (produção gerenciada) vs. pgvector (Postgres).
Fine-tuning de LLMs — LoRA, QLoRA, PEFT e a OpenAI Fine-tuning API
Quando fine-tuning supera RAG e prompt engineering. LoRA: treinar só adaptadores. QLoRA: 4-bit quantization para rodar em consumer GPU. Dataset formato JSONL. Custo real estimado.
Avaliação de LLMs — LLM-as-Judge, RAGAS, TruLens e testes automatizados
Por que testar LLMs é diferente de software convencional. LLM-as-Judge com GPT-4o. RAGAS para pipelines RAG: faithfulness, relevancy, context recall. Regressão de qualidade.
Arquitetura RAG — chunking, embedding, indexação, retrieval e geração
Chunking: tamanho, overlap, estratégias (recursivo, semântico, por seção). Embedding. Indexação. Top-k retrieval. Injeção no contexto. Geração com citação de fontes. O pipeline completo.
RAG Avançado — Hybrid Search, Reranking, HyDE, Multi-Query e Parent-Child chunks
BM25 + embeddings (hybrid). Reranking com Cohere cross-encoder. HyDE: gerar doc hipotético para melhorar retrieval. Multi-query: reescrever pergunta de múltiplas formas.
Tipos de documentos — PDF, Word, HTML, tabelas e multimodal RAG
PyMuPDF, python-docx, BeautifulSoup4. O grande problema de tabelas em RAG. Unstructured.io para documentos complexos. Multimodal RAG: imagens e diagramas no índice.
LlamaIndex — índices, query engines, routers e pipelines RAG enterprise
SimpleDirectoryReader, VectorStoreIndex, SummaryIndex. RouterQueryEngine para múltiplos índices. SubQuestionQueryEngine para queries complexas. LlamaIndex vs. LangChain para RAG.
Projeto — RAG sobre base de conhecimento empresarial com avaliação RAGAS e deploy
Pipeline completo: ingestão → chunking → embedding → Chroma → hybrid retrieval → reranking → geração → avaliação RAGAS. Deploy como API FastAPI com autenticação por API key.
LangChain core — PromptTemplate, ChatModels, OutputParsers e LCEL
LangChain Expression Language (LCEL): o operador pipe |. RunnablePassthrough, RunnableParallel, RunnableLambda. Composição de pipelines declarativa. Streaming nativo.
Memory em LangChain — Buffer, Summary, VectorStore e Entity Memory
ConversationBufferMemory. ConversationSummaryMemory: comprime histórico com LLM. VectorStoreRetrieverMemory: busca semântica no histórico. Entity Memory: rastrear entidades mencionadas.
Tools e ToolCalling — conectar LLMs a funções Python, APIs e bancos de dados
@tool decorator. Pydantic schemas para ferramentas. ToolCalling (OpenAI) vs. Claude tool use. Como o LLM decide qual tool usar. Parallel tool calls. Error handling em tools.
Structured Output com Pydantic — respostas tipadas, validadas e confiáveis
Pydantic v2 para schemas. with_structured_output() no LangChain. model_validate(). JSON schema automático. Retry em caso de falha de parsing. Por que output livre é problema em produção.
O que é um agente — anatomia, loop percepção-decisão-ação e diferença de chatbot
Componentes: LLM (cérebro), Tools (mãos), Memory (memória), Planner (estrategista). O loop agentic. Por que agentes falham: loops infinitos, alucinações de tool use, falta de contexto.
ReAct — Reasoning + Acting — o padrão de agente mais usado do mundo
Thought → Action → Observation → Thought... O paper ReAct (Yao et al., 2022). Implementação do zero sem frameworks. Quando ReAct falha e como detectar loops antes que causem custos.
LangGraph — StateGraph, nodes, edges condicionais e checkpointing
Por que LangGraph supera AgentExecutor. StateGraph com TypedDict. Conditional edges para roteamento. Checkpointing com MemorySaver para estado persistente. Debugging com LangSmith.
Padrões de agentes — sequencial, paralelo, routing, supervisor, map-reduce e sub-grafos
Quando usar cada padrão. Routing condicional baseado em output do LLM. Paralelização de tarefas independentes com Send(). Supervisor que delega para sub-agentes especializados.
OpenAI Assistants API v2 — Threads, Runs, Code Interpreter e File Search
Assistants v2: gerenciamento automático de contexto. Code Interpreter para análise de dados dentro do agente. File Search (RAG nativo). Quando usar vs. LangGraph.
CrewAI — agents com roles, tasks, process sequential e hierarchical
Agent (role, goal, backstory, tools), Task (description, expected_output, agent), Crew (process). YAML para configuração limpa. Ferramentas customizadas via @tool. Projeto completo.
AutoGen/AG2 — conversas entre múltiplos agentes e GroupChat
ConversableAgent, AssistantAgent, UserProxyAgent. GroupChat e GroupChatManager. SpeakerSelection strategies. Por que múltiplos LLMs debatendo chegam a soluções melhores que um único.
Human-in-the-Loop — interrupt(), breakpoints e aprovação humana em workflows
interrupt() no LangGraph para pausa aguardando input humano. Breakpoints para revisão antes de ações irreversíveis (enviar e-mail, fazer deploy, publicar conteúdo). Interface de aprovação.
Memória de longo prazo em agentes — LangMem, Redis e bancos de memória persistente
Por que agentes precisam lembrar além da sessão. Memória episódica (o que aconteceu), semântica (fatos sobre o usuário), procedimental (como fazer X). LangMem. Redis + embeddings.
Ferramentas essenciais — web search (Tavily/Serper), code sandbox (E2B) e file I/O
TavilySearchResults para busca com contexto. E2B para execução de código Python em sandbox seguro. Ferramentas de arquivo: read, write, append, list. Shell tools com guardrails.
MCP — Model Context Protocol — o padrão de integração que está dominando o mercado
O que é MCP (Anthropic, nov/2024). Por que se tornou padrão em meses. MCP servers disponíveis: GitHub, Slack, Notion, Google Drive, Postgres, etc. Criar seu próprio MCP server em Python.
Integrações reais — CRM, WhatsApp, Slack, Gmail, Notion via API e webhooks
HubSpot CRM API. Evolution API para WhatsApp Business. Slack Bolt SDK. Gmail API com OAuth. Notion API. Como dar ao agente acesso ao stack real da empresa com autenticação segura.
n8n — automação visual com nodes de IA, webhooks, schedules e integrações nativas
Self-hosted vs. cloud. Workflow básico. HTTP Request node para qualquer API. Nodes nativos de OpenAI/Anthropic. Trigger: webhook, schedule, form, e-mail, novo item no CRM.
Projetos com n8n + IA — SDR pipeline, monitor de concorrentes e relatório automático
Pipeline SDR: form → enriquecimento (Clay API) → score LLM → HubSpot + Slack alert. Monitor: RSS concorrentes → resumo LLM → newsletter. Relatório: dados → análise → e-mail formatado.
FastAPI — endpoints síncronos/assíncronos, Pydantic, auth e WebSockets para streaming
Path params, query params, request body. Pydantic para validação. Background tasks. WebSockets para streaming de LLM. API key auth. OpenAPI docs automático. Testes com pytest.
Docker — Dockerfile, docker-compose para stack completa e boas práticas para IA
Dockerfile para apps Python. Multi-stage builds. docker-compose: API + Chroma + Redis + Postgres. Variáveis de ambiente seguras. Build e push para Docker Hub / GitHub Container Registry.
Deploy em produção — Railway, Render, Modal (GPU serverless) e monitoramento
Railway para full-stack simples com deploy via GitHub. Modal para GPU serverless (fine-tuning, inferência pesada). Langfuse para observabilidade de LLMs. Alertas de custo e latência.
Projeto 1 — RAG Empresarial: chat com base de conhecimento interna
Stack: ingestão PDF/Word → chunking semântico → Chroma → hybrid retrieval + reranking → LangGraph → FastAPI → Streamlit. Avaliação RAGAS. Deploy Railway. Documentação completa.
Projeto 2 — Agente de Vendas com memória, CRM e integração WhatsApp
Stack: LangGraph + memória Redis + HubSpot API + busca de leads + Evolution API (WhatsApp). Qualifica leads automaticamente usando framework BANT. Human-in-the-loop para fechamento.
Projeto 3 — Pipeline Multi-Agente: pesquisa, análise e relatório automático
CrewAI: agente pesquisador (web search + Tavily) + analista (dados + código) + escritor (relatório) + revisor (qualidade). Entrega PDF por e-mail automaticamente via n8n.
Projeto 4 — Automação SDR: do formulário ao CRM com score de IA sem código Python
n8n: form → webhook → enriquecimento API → scoring LLM (BANT) → se qualificado: HubSpot + Slack alert + e-mail personalizado + agendar reunião Google Calendar. 100% no n8n.
Projeto 5 — Portfólio, GitHub e como vender seus projetos de IA
README técnico perfeito com badges, arquitetura e demo. Apresentação executiva (problema → solução → ROI). Como usar IA para criar conteúdo sobre IA. Posicionamento no LinkedIn.
Formação Completa em Inteligência Artificial — FIA v3.0
136 aulas + 5 projetos · 23 módulos · 3 etapas · ~320 horas · 32 semanas
Baseado em: FIA · UnIA · DeepLearning.AI · Stanford CS229 · MIT 6.S191 · Coursera · Udemy 2025/2026 · fast.ai