VPS पर SearXNG self-host करें।
आपकी अपनी private metasearch, 70+ upstream sources।
SearXNG Google, Bing, DuckDuckGo, Wikipedia और सत्तर और को query करता है — और कभी किसी को नहीं बताता कि कौन पूछ रहा है। तीन Docker commands, एक reverse proxy, एक bookmarklet — और आपके घर के हर browser का default search engine आपका है।
- 01
SearXNG एक metasearch front-end है — अपना कोई index नहीं; queries को 70+ upstream engines पर fan out और aggregate किया जाता है। Fully self-hosted का अर्थ है कोई और आपकी queries नहीं देखता।
- 02
Structural challenge upstream IP reputation है — datacentre IPs CAPTCHAs hit करते हैं। multi-engine fan-out, सामान्य rate limits, और ऐसे host से mitigate करें जिसका IP space abuse heatmap में नहीं है।
- 03
Compound value वह सब है जो आप इसके ऊपर बना सकते हैं — Perplexica AI-search, browser default integration, custom search aliases — सभी आपके private SearXNG द्वारा backed।
SearXNG वास्तव में क्या है। Metasearch, search नहीं।
SearXNG एक Python application है जो, जब आप एक query submit करते हैं, query को parallel में कई upstream search engines पर fan out करता है — Google, Bing, DuckDuckGo, Brave, Mojeek, Wikipedia, GitHub, arXiv, IMDb, Reddit, configuration के अनुसार दर्जनों और — और results को deduplication और source attribution के साथ एक ranked list में merge करता है। इसका अपना crawler या अपना index नहीं है; मूल्य aggregation plus privacy proxy है।
user के नजरिए से: आप एक query टाइप करते हैं, आपको ऐसे results मिलते हैं जो सामान्य search page जैसे दिखते हैं। upstream के नजरिए से: SearXNG instance के IP से एक query आई, बिना cookies, बिना referrer, बिना user identifier के। आपके नजरिए से: SearXNG instance कभी आपकी queries log नहीं करता (default config), और compromise होने पर भी, leak करने के लिए कोई historical search profile नहीं रखता।
Web से परे categories: SearXNG में image search (multiple engines में), video, news, maps, science, files (BitTorrent indices, FTP), social media के लिए built-in support है। result page में प्रत्येक के लिए tabs हैं। category routing का अर्थ है आप एक "code-only" search profile चला सकते हैं जो केवल GitHub, GitLab और SourceGraph query करे, या एक "news-only" search profile, या जो भी।
privacy-aware पाठक के लिए killer feature: SearXNG एक JSON API expose करता है। कुछ भी जिसे search results चाहिए — एक desktop launcher, एक CLI command, एक chatbot, एक AI agent — Google के बजाय आपका SearXNG call कर सकता है। यह SearXNG को search engine से आपके पूरे toolchain के search back-end में बदल देता है।
IP reputation wall। क्यों hyperscaler IPs को CAPTCHA-wall मिलती है।
Upstream search engines scrapers से खुद को rate-limiting और उन IPs से traffic को CAPTCHA-walling करके बचाते हैं जिन्हें वे abusive मानते हैं। Hyperscaler ranges (AWS, GCP, Azure, DigitalOcean, बड़े Hetzner और OVH pools) सबसे अधिक blocked हैं, क्योंकि वही ranges हैं जहाँ अधिकांश scrapers चलते हैं। परिणाम: AWS Lightsail पर SearXNG दस queries के भीतर empty Google results लौटाना शुरू करता है, जबकि कम-trafficked datacentre IP पर वही SearXNG बिना किसी समस्या के महीनों तक चलता है।
Mitigation 1 — host को ध्यान से चुनें। NordBastion VPS Nordic datacentres में स्थित है जिनके IP ranges विशिष्ट scraper-abuse heatmap में नहीं हैं। छोटी, कम व्यस्त ranges का अर्थ है IP neutral reputation के साथ आता है, जो SearXNG को upstream layer पर चाहिए।
Mitigation 2 — aggressively fan out करें। settings.yml को कई upstreams enable करने के लिए edit करें: न केवल Google + Bing, बल्कि Brave, Mojeek, Qwant, Startpage, Marginalia, plus category-specific ones (Wikipedia, GitHub, Reddit) भी। जितने अधिक upstreams आप enable करते हैं, उतना कम traffic कोई एक देखता है, उतनी कम संभावना कि कोई rate-limiting शुरू करे।
Mitigation 3 — अपने users को rate-limit करें। SearXNG में built-in per-IP rate limits (limiter.toml) हैं। उन्हें tune करें ताकि एक single user accidentally scraper-pattern traffic generate न कर सके। default 10 req/min आमतौर पर personal use के लिए सही है।
Mitigation 4 — विशेष रूप से Google के लिए Tor। SearXNG Tor के माध्यम से upstream queries proxying का समर्थन करता है। Google के लिए विशेष रूप से, जो CAPTCHA पर सबसे aggressive है, Tor के माध्यम से queries routing (google engine block पर using_tor_proxy: true) थोड़ी latency के बदले बहुत fresher reputation pool पाता है।
Docker install। "fresh VPS" से "browser default" तक पंद्रह मिनट।
1. Docker इंस्टॉल करें। curl -fsSL https://get.docker.com | sh — आधुनिक Debian/Ubuntu पर Compose v2 उसी package में आता है।
2. आधिकारिक searxng-docker template clone करें। git clone https://github.com/searxng/searxng-docker.git && cd searxng-docker — यह upstream-maintained docker-compose.yml है जो SearXNG को Valkey/Redis sidecar (rate limiter और cache के लिए) और Caddy reverse proxy के साथ bundle करता है।
3. Configure करें। .env edit करें: SEARXNG_HOSTNAME=search.example.com (आपका subdomain) सेट करें, LETSENCRYPT_EMAIL=[redacted-user]@[redacted-host] (Caddy द्वारा ACME registration के लिए उपयोग)। searxng/settings.yml खोलें: server.secret_key को fresh openssl rand -hex 32 पर सेट करें, title/instance_name customize करें, अपने मनचाहे engines enable करें।
4. Launch करें। docker compose up -d — पहला start SearXNG, Valkey और Caddy images pull करता है, TLS certificate generate करता है, stack को up लाता है। https://search.example.com visit करें और SearXNG home page render होता है।
5. engines का परीक्षण करें। कुछ सामान्य खोजें; सत्यापित करें कि results वापस आते हैं। Preferences → Engines खोलें और सत्यापित करें कि प्रत्येक enabled upstream green दिखाता है। यदि Google CAPTCHA error के साथ red दिखाए, chapter 2 की Tor-proxy mitigation पर जाएँ।
यही install है। Updates: docker compose pull && docker compose up -d सप्ताह में एक बार — SearXNG community 48 घंटों के भीतर fixes push करती है जब upstream अपना scraping pattern बदलता है, इसलिए current रहना "सभी engines काम करते हैं" और "Google तीन हफ्तों से broken है" के बीच का अंतर है।
Browser default। Desktop, mobile, terminal।
Firefox। एक बार https://search.example.com visit करें; address-bar overflow menu (...) → "Add Search Engine" click करें; Settings → Search → Default search engine → SearXNG। address bar अब आपके SearXNG के माध्यम से search करता है। Bonus: Search Suggestions → off सेट करें (SearXNG के suggestions default रूप से third party के पास जाते हैं; keystroke को local रखने के लिए disable करें)।
Chrome / Brave / Edge। chrome://settings/searchEngines → Add → name "SearXNG", shortcut "s", URL https://search.example.com/?q=%s — default सेट करें। Brave और Edge पर भी यही flow।
iOS Safari। Safari आपको directly custom search engines जोड़ने नहीं देता, लेकिन open-source Privacy Redirect extension (या अधिक capable Mojo Search Extensions plugin) वहाँ पहुँचाता है। Alternative: Brave या Firefox iOS install करें, SearXNG default सेट करें, searches के लिए उपयोग करें।
Android। Firefox Android — desktop जैसा ही flow। Brave Android — desktop जैसा ही flow। stock Chrome Android पर keyboard-suggestion path एकमात्र अजीब मामला है; वहाँ Firefox उपयोग करें।
Terminal। alias s='function _s(){ xdg-open "https://search.example.com/?q=$*"; }; _s' — एक "s your search query" command जोड़ता है। macOS पर xdg-open को open से replace करें।
Hardening। instance को वास्तव में log-free बनाएँ।
Caddy access logs बंद करें। searxng-docker template का default Caddyfile हर request को एक JSON file में log करता है। आप जो हर search query type करते हैं वह उस log में दिखती है। SearXNG site block के अंदर log { output discard } जोड़ने के लिए Caddyfile edit करें; Caddy reload करें। application अब कहीं भी कोई per-query log नहीं लिखता।
Favicon proxy बंद करें। SearXNG default रूप से result domains के लिए favicons fetch करता है, जो प्रत्येक domain को hint देता है कि किसी ने इसे search किया। settings.yml: search.favicon_resolver: '' इसे disable करता है।
Search suggestions बंद करें। Auto-complete suggestions default रूप से एक third-party endpoint पर forward की जाती हैं। settings.yml: search.suggestion_resolver: '' URL bar suggestions को local रखता है।
यदि आवश्यक न हो तो image proxy बंद करें। SearXNG privacy के लिए result images को अपने माध्यम से proxy करता है; इससे VPS पर bandwidth खर्च होती है। यदि आप image search उपयोग नहीं करते, इसे disable करें (server.image_proxy: false)। यदि करते हैं, इसे on छोड़ें — यह अपना काम कर रहा है।
IP या basic auth द्वारा restrict करें। Public SearXNG instances bot traffic खींचते हैं जो आप अपना upstream budget खाते नहीं देखना चाहते। एक Caddy basic_auth block (एक user, एक password) जोड़ें या site को अपने home और travel IPs तक remote_ip { ... } द्वारा restrict करें। अधिकांश operators अंततः यह करते हैं।
आगे जाएँ — Perplexica AI इसके ऊपर। आपकी private ChatGPT-search।
Perplexica Perplexity AI का open-source clone है — एक AI search interface जो एक natural-language प्रश्न लेता है, sources gather करने के लिए targeted searches चलाता है, फिर citations के साथ एक उत्तर synthesise करता है। clever हिस्सा back-end है: Perplexica अपने search engine के रूप में SearXNG उपयोग करता है, और अपने language model के रूप में एक OpenAI-compatible chat completion API (Ollama locally Llama / Mistral / Qwen चलाता है, या LiteLLM remote provider पर proxying करता है)। दोनों हिस्सों को self-host किया जा सकता है, किसी को भी third party को छूने की जरूरत नहीं।
Install करें। git clone https://github.com/ItzCrazyKns/Perplexica.git, SEARXNG को http://searxng:8080 (chapter 3 का existing container) पर point करने के लिए config.toml edit करें, OLLAMA को http://ollama:11434 या अपने LiteLLM endpoint पर सेट करें, docker compose up -d। Perplexica अब एक second port पर चल रहा है, पूरी तरह आपके SearXNG से जुड़ा।
आपको क्या मिलता है। एक web UI जो Perplexity जैसा दिखता और महसूस होता है — एक प्रश्न टाइप करें, इसे अपने SearXNG के माध्यम से खोजते देखें, इसे sources का सारांश देते देखें, एक cited उत्तर पाएँ। सब कुछ आपके VPS पर होता है; कोई third party प्रश्न, खोज या उत्तर नहीं देखता। research-grade उपयोग के लिए, cited-source संरचना hosted AI products की unattributed-paragraph format से कहीं अधिक ईमानदार है।
Resource cost। SearXNG छोटा ही रहता है। Perplexica स्वयं एक छोटी Next.js app है। language-model cost variable है — Ollama को 7B model के साथ 8 GB RAM चाहिए, 70B model को 64 GB। सामान्य उपयोग के लिए, Perplexica को एक remote OpenAI-compatible endpoint (privacy-focused inference providers में से एक के सामने LiteLLM) पर point करें और VPS हल्का रहता है।
प्रश्न, उत्तरित।
आठ प्रश्न जो private SearXNG instance deploy करने से पहले, उसके दौरान और बाद में उठते हैं।
SearXNG क्या है और यह DuckDuckGo से कैसे अलग है?
SearXNG एक privacy-respecting metasearch engine है — इसका अपना search index नहीं है; इसके बजाय, जब आप इसे query करते हैं, यह आपकी query को 70+ upstream engines (Google, Bing, DuckDuckGo, Wikipedia, Brave, Mojeek, सैकड़ों specialized) को forward करता है और results aggregate करता है। DuckDuckGo एक single search service है जो Bing plus अपने crawler से अपने results proxy करती है। व्यावहारिक अंतर: SearXNG आपको अधिक, व्यापक, कम-filtered results देता है, किसी भी उस upstream को exclude करने के option के साथ जिस पर आप भरोसा नहीं करते।
SearXNG को self-hosting करने से मुझे क्या मिलता है जो public instances नहीं देते?
तीन चीजें। एक: third-party instance पर कोई भी आपकी queries नहीं देख सकता — public instances ऐसे volunteers द्वारा चलाए जाते हैं जिनसे आपका कोई संबंध नहीं है, और एक अति-उत्सुक admin queries log कर सकता है। दो: customisation — अपने upstreams, अपनी weighting, अपनी default categories, बिना समझौते के अपना UI चुनें। तीन: API access — आपका self-hosted SearXNG बाकी सब के लिए privacy back-end है (Perplexica AI, custom scrapers, "search" के लिए आपका terminal alias)।
IP reputation wall क्या है जिसके बारे में मैं पढ़ता रहता हूँ?
जब SearXNG आपके VPS IP से Google या Bing query करता है, तो वे upstreams "एक और datacentre IP automated-looking requests करता है" देखते हैं। Hyperscaler IPs (AWS, GCP, Hetzner, DigitalOcean) सबसे बुरे हैं — वे कुछ queries के भीतर CAPTCHA-walled या 429-rate-limited हो जाते हैं। छोटे, कम-trafficked datacentre IPs अधिक समय तक survive करते हैं। mitigation: ऐसा host चुनें जिसका IP space सामान्य abuse heatmap का हिस्सा नहीं है, और SearXNG को कई upstreams में queries फैलाने के लिए configure करें ताकि कोई भी single upstream rate-limiting शुरू करने के लिए पर्याप्त traffic न देखे।
मुझे कितना VPS चाहिए?
बहुत कम। SearXNG I/O-bound है (upstream HTTP responses का इंतजार), CPU-bound नहीं। 1 vCPU और 512 MB RAM एक single user को आराम से handle करता है। Ravelin tier ($5.90/माह) आराम से oversized है और आपको उसी box पर SearXNG, Perplexica, Vaultwarden और कई अन्य छोटी services चलाने देता है।
क्या मैं Firefox या Chrome में SearXNG को अपना default search engine बना सकता हूँ?
हाँ — दोनों browsers OpenSearch auto-discovery का समर्थन करते हैं। एक बार आपका SearXNG https://search.example.com पर होने पर, Firefox में वहाँ browse करें; URL bar overflow menu "Add Search Engine" offer करता है। Chrome पर, address bar पर right-click करें और "Manage search engines"; SearXNG discovered list में दिखता है। इसे default सेट करें और URL-bar search अब आपके privacy instance के माध्यम से flow करती है।
क्या SearXNG instance मेरी queries log करता है?
Default रूप से नहीं — यही पूरा उद्देश्य है। SearXNG application level पर logging disabled के साथ आता है। इसके सामने web server (Caddy, Nginx) default रूप से access logs लिखता है जिनमें request URL शामिल है, जिसमें search query शामिल है। इस guide का hardening chapter उन access logs को बंद करना cover करता है ताकि instance वास्तव में log-free बने।
Perplexica क्या है और इस guide में इसका उल्लेख क्यों है?
Perplexica Perplexity AI का open-source clone है — एक AI-search interface जो natural-language प्रश्न लेता है, sources gather करने के लिए search queries चलाता है, और citations के साथ उत्तर synthesise करता है। यह अपने search back-end के रूप में SearXNG उपयोग करता है। दोनों को self-host करने का अर्थ है आपको एक private AI-search interface मिलता है जहाँ AI locally चलता है (Ollama या LiteLLM एक OpenAI-compatible endpoint के सामने) और searches आपके SearXNG के माध्यम से जाती हैं। यह combination ChatGPT search का privacy-respecting analogue है।
किसी भी सस्ते VPS पर नहीं बल्कि privacy VPS पर SearXNG host क्यों करें?
क्योंकि वह IP जहाँ से आपका SearXNG query करता है आपकी हर खोज देखती है। यह DNS जैसी ही metadata समस्या है — आपका DNS देखने वाला third party जानता है कि आप कहाँ जाते हैं। आपकी real identity के तहत किराए पर लिए गए VPS पर SearXNG, आपके card से billed, एक ऐसे jurisdiction में जो datacentres से logs compel करता है, ने समस्या हल नहीं की है; बस उसे स्थानांतरित किया है। एक no-KYC crypto-paid Nordic VPS metadata layer को application layer की privacy guarantees के अनुरूप रखता है।
आपकी निजी खोज के लिए एक Nordic VPS। KYC-मुक्त, crypto-भुगतान।
Ravelin (2 vCPU, 4 GB, $5.90/माह) उसी box पर SearXNG + Vaultwarden + कुछ अन्य छोटी services handle करता है। Nordic IPs जो scrapers द्वारा ground down नहीं हुए हैं।
अंतिम review · 2026-05-20 · स्रोत · SearXNG के अपस्ट्रीम दस्तावेज़, searxng-docker टेम्पलेट, Perplexica रिपॉज़िटरी, OpenSearch description spec · आवृत्ति · वार्षिक
Anonymous VPS hosting in 2026 — the cluster.
This guide is one spoke of a larger series. The pillar walks the three privacy layers end to end — the sibling spokes below dive into the specifics.
Three independent layers — signup, payment, network — explained, legal context included, common mistakes flagged.
Bitwarden-compatible password vault under your own control.
Files, calendar, contacts, photos — owned, not rented.
Postfix, Dovecot, SPF/DKIM/DMARC — deliverability included.
What “no KYC” actually means — and what it does not.