como parsear posts do trump no truth social com python 2026

Atualizado: 17 de abril de 2026 · 8 min · Grátis

Por que parsear o Truth Social é valioso para traders e desenvolvedores

O Truth Social se tornou a principal plataforma de comunicação de Donald Trump desde 2022, e em 2026 continua sendo a fonte primária onde o presidente anuncia políticas econômicas, tarifas, sanções e opiniões sobre o mercado financeiro. Para desenvolvedores e traders que constroem sistemas de trading algorítmico, ter acesso programático a esses posts em tempo real é um diferencial competitivo enorme.

A ausência de uma API oficial pública força os desenvolvedores a usar alternativas: o feed RSS público da plataforma, scraping com Playwright ou Selenium, ou bibliotecas não oficiais mantidas pela comunidade. Cada método tem suas vantagens, limitações e trade-offs de latência versus complexidade. Este guia apresenta os três métodos com exemplos de código prontos para usar, e discute como integrá-los com sistemas de alerta via Telegram e databases para análise histórica.

Para o contexto brasileiro, o parsing do Truth Social alimenta sistemas que geram sinais para ativos como VALE3 (sensível a tarifas sobre metais), PETR4 (energia e sanções), BDRs e contratos cambiais WDO na B3. Construir seu próprio parser significa ter controle total sobre a lógica de filtragem e a velocidade de resposta, sem depender de serviços de terceiros.

Método 1: Feed RSS com feedparser (mais simples)

O Truth Social expõe um feed RSS público para cada perfil de usuário. Para Trump, a URL é https://truthsocial.com/@realDonaldTrump.rss. Este é o método mais confiável e com menor chance de bloqueio, pois o RSS é explicitamente disponibilizado pela plataforma.

O código Python básico usa as bibliotecas feedparser e schedule. Instale com pip install feedparser schedule python-telegram-bot. O script verifica o feed a cada 60 segundos, armazena os IDs dos posts já processados em um arquivo local ou SQLite, e envia para o Telegram apenas os posts novos. Para filtragem por palavras-chave, use any(kw in entry.summary.lower() for kw in keywords) onde keywords é uma lista como ['tariff', 'china', 'trade', 'fed', 'rate', 'brazil', 'oil', 'steel'].

A latência típica desse método é de 60 a 180 segundos. O feed RSS não é atualizado instantaneamente após cada post; há um delay de propagação do servidor. Para a maioria dos swing traders e investidores de posição, essa latência é completamente aceitável. O código roda em qualquer servidor Linux com Python 3.8+, e pode ser gerenciado como serviço systemd para garantir reinício automático em caso de falha.

Método 2: Scraping com Playwright (menor latência)

Para latência abaixo de 30 segundos, o Playwright permite simular um navegador real e fazer verificações mais frequentes da timeline do Trump. Instale com pip install playwright && playwright install chromium. A vantagem do Playwright sobre o Selenium é a API assíncrona nativa, que permite múltiplas verificações simultâneas sem bloquear o thread principal.

O script com Playwright faz login na conta (necessário para visualizar o perfil completo), navega para a timeline de Trump, extrai os posts mais recentes via seletores CSS, e compara com o último post processado. Como o Truth Social usa renderização JavaScript (React/Vue), o Playwright é necessário para obter o conteúdo real — o requests simples só retorna o HTML inicial sem os posts carregados dinamicamente.

Um detalhe importante: o Playwright em modo headless com a flag --no-sandbox é necessário em servidores VPS sem interface gráfica. Configure também o user_agent para um browser real e adicione intervalos aleatórios entre as requisições (await asyncio.sleep(random.uniform(15, 45))) para reduzir a chance de detecção como bot. Armazene cookies de sessão para evitar login repetido a cada execução.

Método 3: APIs não oficiais e agregadores de dados

Existem projetos open-source e serviços pagos que mantêm acesso programático ao Truth Social através de engenharia reversa da API interna da plataforma. A mais conhecida é a biblioteca truthsocial-api no GitHub (verifique o repositório ativo mais recente, pois a manutenção é irregular). Esses projetos exploram os endpoints REST que o aplicativo móvel do Truth Social usa internamente, geralmente autenticando via OAuth2 com as mesmas credenciais de usuário.

Serviços pagos como Dataminr, Brandwatch e NewsWhip oferecem cobertura do Truth Social em seus planos, mas os preços começam em US$ 500/mês — fora do alcance da maioria dos traders individuais. Uma alternativa mais acessível são os agregadores especializados em declarações de políticos, que oferecem webhooks ou streaming APIs por US$ 50-200/mês.

O TrumpBot combina todos esses métodos com redundância — se um feed falha, outro assume automaticamente — garantindo tempo de disponibilidade acima de 99,5%. Para desenvolvedores que preferem não manter a infraestrutura própria, a API do TrumpBot oferece acesso via webhook com latência abaixo de 5 segundos e preço significativamente menor que os grandes agregadores de dados.

Estrutura de dados e armazenamento para análise histórica

Um parser profissional não apenas detecta posts novos, mas constrói um histórico estruturado para análise. A estrutura de dados recomendada para cada post inclui: post_id, timestamp_utc, text_raw, text_clean (sem HTML), keywords_matched, sentiment_score (positivo/negativo/neutro), categories (tariff/trade/monetary/domestic/other), e market_reaction_5min (campo para preenchimento posterior com dados de preço).

Para o banco de dados, PostgreSQL é a escolha profissional (suporta full-text search, JSON nativo e time-series queries eficientes). Para projetos menores, SQLite é suficiente e elimina a necessidade de um servidor de banco separado. O dataset histórico é valioso para backtesting: você pode correlacionar posts históricos com movimentos de preço de ativos como VALE3, BRL/USD e contratos futuros de índice na B3.

Método Latência Complexidade Risco de bloqueio Custo
RSS + feedparser 60-180 seg Baixa Muito baixo Grátis
Playwright scraping 15-45 seg Média Médio US$ 5-15/mês (VPS)
API não oficial 5-15 seg Alta Alto Grátis (manutenção própria)
TrumpBot API < 5 seg Baixa Nenhum Grátis / US$ 29+
Dataminr / NewsWhip < 2 seg Baixa Nenhum US$ 500+/mês

Perguntas frequentes

O Truth Social tem uma API oficial pública?

Não existe API pública oficial do Truth Social para desenvolvedores externos. As opções disponíveis são feed RSS público, scraping com Playwright/Selenium, e APIs não oficiais mantidas pela comunidade open-source. O TrumpBot oferece uma API com cobertura do Truth Social como alternativa gerenciada.

Parsear o Truth Social viola os termos de serviço?

Os termos do Truth Social proíbem scraping automatizado. O uso do RSS público é tecnicamente permitido pois é disponibilizado explicitamente pela plataforma. Para uso comercial ou em larga escala, consulte um advogado especializado em direito digital. Para uso pessoal de trading, o risco prático é baixo.

Qual biblioteca Python é melhor: feedparser ou Playwright?

Para latência acima de 1 minuto, feedparser é mais simples e confiável. Para latência abaixo de 30 segundos e mais controle sobre o conteúdo, Playwright é a escolha certa. Combine os dois para redundância: feedparser como método principal e Playwright como fallback para alta prioridade.

Como evitar bloqueio de IP ao fazer scraping?

Use intervalos aleatórios entre requisições (random.uniform(10,30) segundos), rotação de user-agents, e considere um proxy residencial para alta frequência. Para frequência baixa (a cada 1-5 minutos), geralmente não é necessário proxy. Implemente backoff exponencial para lidar com erros 429.

Em qual servidor devo rodar o bot de parsing?

Para traders brasileiros, um VPS nos EUA (DigitalOcean New York, AWS us-east-1) reduz a latência de rede para o Truth Social. Custo médio: US$ 6-12/mês. Provedores como Hostinger e Contabo têm planos ainda mais baratos. O importante é baixa latência para os servidores do Truth Social, não para o Brasil.

Como conectar o parser Python ao Telegram?

Use a biblioteca python-telegram-bot (versão 20+, assíncrona). Crie um bot via @BotFather no Telegram, obtenha o token, e use await bot.send_message(chat_id, text, parse_mode='HTML') para enviar alertas formatados. Para alta frequência, use o método send_message com asyncio.Queue para evitar flood limits do Telegram (30 mensagens/segundo máximo).

Posso usar o parser para monitorar outros políticos além do Trump?

Sim. O mesmo código RSS/Playwright funciona para qualquer conta do Truth Social. Você pode monitorar membros do Congresso, secretários do gabinete e outros que influenciam o mercado, como o Secretário do Tesouro e membros do Fed. A lógica de filtragem por palavras-chave se aplica igualmente a todas as contas.

Qual é o intervalo mínimo seguro para polling do RSS sem ser bloqueado?

Para feeds RSS públicos, intervalos de 30-60 segundos são geralmente seguros e não causam bloqueio. Abaixo de 15 segundos, você corre risco de receber erros 429 (Too Many Requests). O ideal é 60 segundos com tratamento de erros e backoff exponencial: em caso de erro, dobrar o intervalo até um máximo de 10 minutos.