Auto-hospede o SearXNG em um VPS.
Sua própria metabusca privada, 70+ fontes upstream.
O SearXNG consulta Google, Bing, DuckDuckGo, Wikipedia e mais setenta — e nunca diz a nenhum deles quem está perguntando. Três comandos Docker, um reverse proxy, um bookmarklet — e o mecanismo de busca padrão de cada navegador da sua casa é seu.
- 01
O SearXNG é um front-end de metabusca — sem índice próprio; as consultas são distribuídas para 70+ mecanismos upstream e agregadas. Totalmente auto-hospedado significa que ninguém mais vê suas consultas.
- 02
O desafio estrutural é a reputação de IP upstream — IPs de datacenters recebem CAPTCHAs. Mitigue com distribuição para múltiplos mecanismos, limites de taxa modestos, e um provedor cujo espaço de IP não esteja no mapa de abuso.
- 03
O valor composto é tudo que você pode construir em cima — busca com IA do Perplexica, integração como padrão do navegador, aliases de busca personalizados — tudo suportado pelo seu SearXNG privado.
O que o SearXNG realmente é. Metabusca, não busca.
O SearXNG é uma aplicação Python que, quando você envia uma consulta, a distribui em paralelo para muitos mecanismos de busca upstream — Google, Bing, DuckDuckGo, Brave, Mojeek, Wikipedia, GitHub, arXiv, IMDb, Reddit, dezenas de outros dependendo da configuração — e funde os resultados em uma lista classificada com deduplicação e atribuição de fonte. Não possui seu próprio crawler nem seu próprio índice; o valor está na agregação mais o proxy de privacidade.
Do ponto de vista do usuário: você digita uma consulta e obtém resultados que parecem uma página de busca normal. Do ponto de vista do upstream: chegou uma consulta do IP da instância SearXNG, sem cookies, sem referrer, sem identificador de usuário. Do seu ponto de vista: a instância SearXNG nunca registra suas consultas (configuração padrão) e, mesmo que comprometida, não guarda nenhum perfil histórico de buscas para vazar.
Categorias além da web: SearXNG tem suporte nativo para busca de imagens (em múltiplos motores), vídeo, notícias, mapas, ciência, arquivos (índices BitTorrent, FTP), redes sociais. A página de resultados tem abas para cada uma. O roteamento por categoria significa que você pode rodar um perfil de busca «só código» que consulta apenas GitHub, GitLab e SourceGraph, ou um perfil de busca «só notícias», ou qualquer outra coisa.
O recurso matador para um leitor consciente de privacidade: o SearXNG expõe uma API JSON. Qualquer coisa que precise de resultados de busca — um launcher de desktop, um comando CLI, um chatbot, um agente de IA — pode chamar seu SearXNG em vez do Google. Isso transforma o SearXNG de um mecanismo de busca no back-end de busca de toda a sua cadeia de ferramentas.
O muro de reputação de IP. Por que IPs de hyperscalers recebem bloqueio de CAPTCHA.
Os mecanismos de busca upstream se protegem contra scrapers limitando a taxa e bloqueando com CAPTCHA o tráfego de IPs que consideram abusivos. Os intervalos de hyperscalers (AWS, GCP, Azure, DigitalOcean, os pools maiores de Hetzner e OVH) são os mais bloqueados, porque nesses intervalos é onde a maioria dos scrapers roda. O resultado: o SearXNG no AWS Lightsail começa a retornar resultados Google vazios dentro de dez consultas, enquanto o mesmo SearXNG em um IP de datacenter menos trafegado roda por meses sem problema.
Mitigação 1 — escolha o provedor com cuidado. Um VPS da NordBastion está em datacentres nórdicos cujos intervalos de IP não estão no mapa de abuso típico de scrapers. Os intervalos menores e menos movimentados significam que o IP chega com reputação neutra, que é exatamente o que o SearXNG precisa na camada upstream.
Mitigação 2 — distribua agressivamente. Edite o settings.yml para ativar muitos upstreams: não apenas Google + Bing, mas também Brave, Mojeek, Qwant, Startpage, Marginalia, além dos específicos por categoria (Wikipedia, GitHub, Reddit). Quanto mais upstreams você ativar, menos tráfego cada um vê, menos provável que algum comece a aplicar rate-limiting.
Mitigação 3 — aplique rate-limit aos seus próprios usuários. O SearXNG tem limites de taxa por IP integrados (limiter.toml). Ajuste-os para que um único usuário não possa gerar acidentalmente tráfego com padrão de scraper. O padrão de 10 req/min geralmente é adequado para uso pessoal.
Mitigação 4 — Tor especificamente para o Google. O SearXNG suporta proxy de consultas upstream pelo Tor. Para o Google em particular, que é o mais agressivo em CAPTCHA, rotear consultas pelo Tor (using_tor_proxy: true no bloco do mecanismo google) troca um pouco de latência por um conjunto de reputação muito mais fresco.
A instalação Docker. Quinze minutos de "VPS novo" ao "padrão do navegador".
1. Instale o Docker. curl -fsSL https://get.docker.com | sh — o Compose v2 vem no mesmo pacote no Debian/Ubuntu moderno.
2. Clone o template oficial searxng-docker. git clone https://github.com/searxng/searxng-docker.git && cd searxng-docker — este é o docker-compose.yml mantido pelo upstream que agrupa o SearXNG com um sidecar Valkey/Redis (para o limitador de taxa e cache) e um reverse proxy Caddy.
3. Configurar. Edite o .env: defina SEARXNG_HOSTNAME=search.example.com (seu subdomínio), [email protected] (usado pelo Caddy para registro ACME). Abra searxng/settings.yml: defina server.secret_key com um novo openssl rand -hex 32, personalize o título/instance_name e ative os mecanismos desejados.
4. Inicie. docker compose up -d — o primeiro início puxa as imagens do SearXNG, Valkey e Caddy, gera o certificado TLS, sobe o stack. Acesse https://search.example.com e a página inicial do SearXNG é renderizada.
5. Teste os mecanismos de busca. Pesquise algo comum; verifique que os resultados retornam. Abra Preferências → Mecanismos e verifique se cada upstream habilitado aparece em verde. Se o Google aparecer em vermelho com erro de CAPTCHA, vá para a mitigação de proxy Tor do capítulo 2.
Essa é a instalação. Atualizações: docker compose pull && docker compose up -d uma vez por semana — a comunidade SearXNG publica correções em 48 horas quando um upstream muda seu padrão de scraping, então manter-se atualizado é a diferença entre "todos os mecanismos funcionam" e "o Google está quebrado há três semanas".
Padrão do navegador. Desktop, móvel, terminal.
Firefox. Acesse https://search.example.com uma vez; clique no menu de overflow da barra de endereço (...) → "Adicionar Mecanismo de Busca"; Configurações → Busca → Mecanismo de busca padrão → SearXNG. A barra de endereço agora pesquisa pelo seu SearXNG. Bônus: desative Sugestões de Busca → desligado (as sugestões do SearXNG vão para um terceiro por padrão; desative para manter as teclas digitadas locais).
Chrome / Brave / Edge. chrome://settings/searchEngines → Adicionar → nome "SearXNG", atalho "s", URL https://search.example.com/?q=%s — defina como padrão. Mesmo fluxo no Brave e Edge.
iOS Safari. O Safari não permite adicionar mecanismos de busca personalizados diretamente, mas a extensão de código aberto Privacy Redirect (ou o plugin mais completo Mojo Search Extensions) resolve isso. Alternativa: instale o Brave ou Firefox iOS, defina o SearXNG como padrão, e use-o para pesquisas.
Android. Firefox Android — mesmo fluxo que o desktop. Brave Android — mesmo fluxo que o desktop. O caminho de sugestão pelo teclado no Chrome Android padrão é o único caso complicado; use Firefox nesses casos.
Linha de comando. alias s='function _s(){ xdg-open "https://search.example.com/?q=$*"; }; _s' — adiciona um comando "s sua consulta de busca". No macOS substitua xdg-open por open.
Hardenização. Torne a instância genuinamente sem logs.
Desative os logs de acesso do Caddy. O Caddyfile padrão no template searxng-docker registra cada requisição em um arquivo JSON. Cada consulta de busca que você digita aparece nesse log. Edite o Caddyfile para adicionar log { output discard } dentro do bloco de site do SearXNG; recarregue o Caddy. A aplicação agora não escreve nenhum log por consulta em lugar nenhum.
Desative o proxy de favicon. O SearXNG busca favicons para os domínios dos resultados por padrão, o que dá a cada domínio uma dica de que alguém o pesquisou. settings.yml: search.favicon_resolver: '' desativa isso.
Desative as sugestões de busca. As sugestões de autocompletar são encaminhadas para um endpoint de terceiros por padrão. settings.yml: search.suggestion_resolver: '' faz as sugestões da barra de URL permanecerem locais.
Desative o proxy de imagens se não for necessário. O SearXNG faz proxy das imagens dos resultados por si mesmo para privacidade; isso consome largura de banda no VPS. Se você não usar busca de imagens, desative-o (server.image_proxy: false). Se usar, deixe ativado — ele está fazendo seu trabalho.
Restrinja por IP ou autenticação básica. Instâncias públicas de SearXNG atraem tráfego de bots que você não quer consumindo seu orçamento de upstream. Adicione um bloco basic_auth do Caddy (um usuário, uma senha) ou restrinja o site por remote_ip { ... } aos seus IPs domésticos e de viagem. A maioria dos operadores acaba fazendo isso.
Indo além — Perplexica AI por cima. Sua busca ChatGPT privada.
Perplexica é um clone de código aberto do Perplexity AI — uma interface de busca com IA que recebe uma pergunta em linguagem natural, executa buscas direcionadas para coletar fontes e sintetiza uma resposta com citações. A parte inteligente é o back-end: Perplexica usa SearXNG como motor de busca e uma API de conclusão de chat compatível com OpenAI (Ollama rodando Llama / Mistral / Qwen localmente, ou LiteLLM como proxy para um provedor remoto) como modelo de linguagem. As duas metades podem ser auto-hospedadas; nenhuma precisa tocar um terceiro.
Instale. git clone https://github.com/ItzCrazyKns/Perplexica.git, edite config.toml para apontar SEARXNG para http://searxng:8080 (o container existente do capítulo 3), defina OLLAMA em http://ollama:11434 ou seu endpoint LiteLLM, docker compose up -d. O Perplexica agora está rodando em uma segunda porta, totalmente integrado ao seu SearXNG.
O que você obtém. Uma interface web com a aparência e sensação do Perplexity — digite uma pergunta, veja-a buscar pelo seu SearXNG, veja-a resumir as fontes, obtenha uma resposta com citações. Tudo acontece no seu VPS; nenhum terceiro vê a pergunta, as buscas ou a resposta. Para uso de nível de pesquisa, a estrutura com fontes citadas é muito mais honesta do que o formato de parágrafos sem atribuição para o qual os produtos de IA hospedados tendem.
Custo de recursos. O SearXNG continua pequeno. O Perplexica em si é uma pequena aplicação Next.js. O custo do modelo de linguagem é a variável — executar o Ollama com um modelo de 7B requer 8 GB de RAM, um modelo de 70B requer 64 GB. Para uso modesto, aponte o Perplexica para um endpoint remoto compatível com OpenAI (LiteLLM na frente de um dos provedores de inferência com foco em privacidade) e o VPS permanece leve.
Perguntas, respondidas.
Oito perguntas que surgem antes, durante e após implantar uma instância privada de SearXNG.
O que é o SearXNG e como é diferente do DuckDuckGo?
O SearXNG é um mecanismo de metabusca que respeita a privacidade — não tem seu próprio índice de busca; em vez disso, quando você o consulta, ele encaminha sua consulta para 70+ mecanismos upstream (Google, Bing, DuckDuckGo, Wikipedia, Brave, Mojeek, centenas de especializados) e agrega os resultados. O DuckDuckGo é um serviço de busca único que faz proxy dos seus próprios resultados do Bing mais o seu próprio crawler. A diferença prática: o SearXNG fornece resultados mais amplos, menos filtrados, com a opção de excluir qualquer upstream em que você não confia.
O que a auto-hospedagem do SearXNG me dá que as instâncias públicas não dão?
Três coisas. Uma: ninguém em uma instância de terceiros pode ver suas consultas — instâncias públicas são executadas por voluntários com quem você não tem relacionamento, e um admin excessivamente zeloso pode registrar consultas. Duas: personalização — escolha seus upstreams, sua ponderação, suas categorias padrão, sua interface sem compromisso. Três: acesso à API — seu SearXNG auto-hospedado é o back-end de privacidade para tudo o mais (IA do Perplexica, scrapers personalizados, seu alias de terminal para "busca").
O que é o muro de reputação de IP que continuo lendo sobre?
Quando o SearXNG consulta Google ou Bing a partir do IP do seu VPS, esses upstreams veem "mais um IP de datacenter fazendo requisições com aparência automatizada". IPs de hyperscalers (AWS, GCP, Hetzner, DigitalOcean) são os piores — recebem bloqueio de CAPTCHA ou limite de taxa 429 dentro de algumas consultas. IPs de datacenters menores e menos trafegados sobrevivem por mais tempo. A mitigação: escolha um provedor cujo espaço de IP não faça parte do mapa de abuso usual, e configure o SearXNG para distribuir consultas por muitos upstreams para que nenhum único veja tráfego suficiente para começar a limitar a taxa.
Quanto de VPS preciso?
Muito pouco. O SearXNG é limitado por I/O (aguardando respostas HTTP upstream), não por CPU. 1 vCPU e 512 MB de RAM atende um usuário único confortavelmente. O tier Ravelin ($5,90/mês) é confortavelmente superdimensionado e permite executar SearXNG, Perplexica, Vaultwarden e vários outros serviços pequenos na mesma máquina.
Posso definir o SearXNG como meu mecanismo de busca padrão no Firefox ou no Chrome?
Sim — ambos os navegadores suportam auto-descoberta OpenSearch. Depois que seu SearXNG estiver em https://search.example.com, navegue até lá no Firefox; o menu de overflow da barra de URL oferece "Adicionar Mecanismo de Busca". No Chrome, clique com o botão direito na barra de endereço e "Gerenciar mecanismos de busca"; o SearXNG aparece na lista descoberta. Defina-o como padrão e a busca pela barra de URL agora flui pela sua instância de privacidade.
A instância SearXNG registra minhas consultas?
Não por padrão — esse é o ponto central. O SearXNG é distribuído com o registro desativado no nível da aplicação. O servidor web na sua frente (Caddy, Nginx) por padrão escreve logs de acesso que incluem a URL da requisição, a qual inclui a consulta de busca. O capítulo de hardenização neste guia cobre como desativar esses logs de acesso para que a instância se torne genuinamente sem logs.
O que é o Perplexica e por que é mencionado neste guia?
Perplexica é um clone de código aberto do Perplexity AI — uma interface de busca com IA que recebe uma pergunta em linguagem natural, executa consultas de busca para coletar fontes e sintetiza uma resposta com citações. Usa SearXNG como back-end de busca. Auto-hospedar os dois significa obter uma interface de busca com IA privada onde a IA roda localmente (Ollama ou LiteLLM na frente de um endpoint compatível com OpenAI) e as buscas passam pelo seu SearXNG. A combinação é o análogo respeitoso à privacidade do ChatGPT search.
Por que hospedar o SearXNG em um VPS de privacidade em vez de qualquer um barato?
Porque o IP a partir do qual o seu SearXNG faz consultas vê todas as suas buscas. Esse é o mesmo problema de metadados do DNS — um terceiro monitorando seu DNS sabe aonde você vai. Um SearXNG em um VPS alugado sob sua identidade real, cobrado no seu cartão, em uma jurisdição que obriga datacentres a manter logs, não resolveu o problema; apenas o moveu. Um VPS nórdico sem KYC e pago em cripto mantém a camada de metadados alinhada com as garantias de privacidade que a camada de aplicação oferece.
Um VPS nórdico para sua busca privada. Sem KYC, pago em cripto.
O Ravelin (2 vCPU, 4 GB, $5,90/mês) suporta SearXNG + Vaultwarden + alguns outros serviços pequenos na mesma máquina. IPs Nordic que não foram desgastados por scrapers.
Última revisão · 2026-05-20 · Fontes · Documentação upstream do SearXNG, template searxng-docker, repositório do Perplexica, especificação OpenSearch description · Cadência · anualmente
Anonymous VPS hosting in 2026 — the cluster.
This guide is one spoke of a larger series. The pillar walks the three privacy layers end to end — the sibling spokes below dive into the specifics.
Three independent layers — signup, payment, network — explained, legal context included, common mistakes flagged.
Bitwarden-compatible password vault under your own control.
Files, calendar, contacts, photos — owned, not rented.
Postfix, Dovecot, SPF/DKIM/DMARC — deliverability included.
What “no KYC” actually means — and what it does not.