使用Docker部署SearXNG

news/2025/2/24 10:22:22

SearXNG 搜索引擎

SearXNG 是一个整合了超过70个搜索服务结果的免费的私有互联网搜索引擎,用户不会被网站跟踪或被建立档案进行特征分析,良好地保障了用户的隐私。知识库可以有效地弥补大模型的知识欠缺问题,但依旧无法补充或弥补知识库和大模型知识陈旧的问题,于是让大模型联网成为了非常重要的功能。

本章将介绍如何使用 Docker Compose 部署属于私人的 SearXNG 服务,项目地址点击即跳转。

Docker Compose 部署

可能会有小伙伴要问为啥不使用 SearXNG 官方维护的 SearXNG-Docker 项目 ?官方的这个项目默认使用的 Caddy 作为反向代理,最有可能出现的一个问题是会和你服务器上的 80 端口出现冲突,导致 SearXNG 无法与你的服务器上的其它网站共存。而注释掉官方项目中 docker-compose.yaml 有关 Caddy 的部分,就不如自行部署了。

首先创建一个路径用于存放配置文件。

mkdir {Your Path}\SearXNG && cd SearXNG

进入该路径之后使用 vim 创建 docker-compose.yaml 文件。

vim docker-compose.yaml

将下面的内容粘贴到文件内并保存

name: searxng

services:
  searxng:
    container_name: searxng
    image: searxng/searxng:latest
    restart: unless-stopped
    ports:
      - 8080:8080
    volumes:
      - ./searxng:/etc/searxng  # 默认在该文件所在的目录层级创建配置文件夹
    environment:
      - SEARXNG_BASE_URL=http://${SEARXNG_HOSTNAME:-localhost}/
      - SEARXNG_SECRET=${SEARXNG_SECRET}
      - SEARXNG_REDIS_URL=${SEARXNG_REDIS_URL:-redis://redis:6379}
      - UWSGI_WORKERS=${SEARXNG_UWSGI_WORKERS:-10}
      - UWSGI_THREADS=${SEARXNG_UWSGI_THREADS:-10}
		logging:
      driver: "json-file"
      options:
        max-size: "1m"
        max-file: "1"
    networks:
      1panel-network:
        ipv4_address: 172.18.0.239

  redis:
    image: redis:alpine
    container_name: searxng-redis
    networks:
      1panel-network:
        ipv4_address: 172.18.0.240
    command: redis-server --bind 0.0.0.0


networks:
  1panel-network:
    external: true

需要注意的是:所有的 Networks 部分需要根据你的 Docker 容器的实际网络配置进行修改,且需要确认分配的 ipv4_address 地址在 Docker 容器的网络内没有被占用。

保存之后使用下面的指令创建、更新并运行容器

sudo docker-compose up -d

你可以看到,在 {Your Path}\SearXNG 路径之下,创建了一个新的文件夹 searxng,该文件夹用于存放配置文件 settings.yml

在浏览器输入网址 http://Server-IP:Port 即可访问搜索引擎。

SearXNG 搜索页面

定制 SearXNG Engine

Internet Proxy

该项目是一个国外主导的开源私人搜索引擎,因此由于众所周知的原因,只能访问少量的搜索引擎,例如:Bing[通用搜索]、Bilibili[视频搜索]、Github[信息技术]、Arxiv[学术] 等等。如果需要访问更多的搜索引擎,需要使用网络代理服务。

进入到部署路径的 searxng 文件夹,就是刚才生成的那个文件夹,里面有一个 settings.yml 文件,使用具有权限的 vim 打开。

sudo vim settings.yml

配置的位置位于 outgoing 部分,如下下面的这部分前面的 # 删除

  #  proxies:
  #    all://:
  #      - http://proxy1:8080
  #      - http://proxy2:8080

你可以配置一个或多个代理用于访问搜索引擎,需要将 http://proxy:8080 替换成你的代理的地址。

除此之外,还可以设置请求超时.

request_timeout: 3.0

修改完成后需要重启容器,设置立即生效。

Search Formats

项目默认的搜索返回的格式为 html 格式,在使用网络爬虫或其它形式的分析器调用 API 时,希望返回 json 格式,这时就需要修改返回格式。

进入到部署路径的 searxng 文件夹,就是刚才生成的那个文件夹,里面有一个 settings.yml 文件,使用具有权限的 vim 打开。

sudo vim settings.yml

配置的位置位于 search 部分,在 formats 后按照格式添加你需要的格式,如下所示。

# formats: [html, csv, json, rss]
formats:
  - html
  - csv
  - json
  - rss

修改完成之后需要重启容器,设置立即生效。

调用 API 时,可以指定开启的格式:

http://Server-IP:Port/search?q=xxx&format=json

效果如下:

Json 格式返回搜索结果

SearXNG Search API

基础的API地址如下:

http://Server-IP:Port/search

搜索内容 q, required

http://Server-IP:Port/search?q=xxx

返回格式 format, optional

格式有 [ json, csv, rss ],三选一

http://Server-IP:Port/search?q=xxx&format=json

搜索分类 categories, optional

http://Server-IP:Port/search?q=xxx&categories=general

可选的类别有:

分类名称
general综合
images图片
videos视频
news新闻
map地图
music音乐
it信息技术
science科学
files文件
social_media社交媒体

搜索页数 pageno, default 1

搜索第几页的内容,推荐5页及以内。

http://Server-IP:Port/search?q=xxx&pageno=1

搜索引擎 engines, optional

http://Server-IP:Port/search?q=xxx&=apple&engines=google,bing,duckduckgo

具体的搜索引擎查询官方文档


http://www.niftyadmin.cn/n/5864206.html

相关文章

250223-Linux/MacOS如何跳过Miniconda的条款阅读,直接安装Miniconda

你可以通过将 -b 参数传递给 Miniconda 的安装脚本,来跳过条款阅读并自动同意许可条款。这样安装会自动进行到下一步的选择项。下面是具体的安装命令: bash Miniconda3-latest-Linux-x86_64.sh -b这里的 -b 代表“批量模式”(batch mode&…

Https解决了Http的哪些问题

部分内容来源:小林coding 详细解析 Http的风险 HTTP 由于是明文传输,所以安全上存在以下三个风险: 1.窃听风险 比如通信链路上可以获取通信内容,用户号容易没。 2.篡改风险 比如强制植入垃圾广告,视觉污染&#…

【深度解析】Java接入DeepSeek大模型:从零实现流式对话+多轮会话管理(完整项目实战) —— SpringBoot整合、API安全封装、性能优化全攻略

一、DeepSeek接入全景图:不只是API调用 核心优势对比 特性DeepSeek其他主流模型免费Token额度500万/月通常10-100万响应延迟平均800ms1-3s流式响应兼容性原生支持需定制适配中文理解能力行业Top中等偏上 适用场景推荐 智能客服(实时反馈)…

ubuntu中打包与压缩命令详解

Ubuntu 中打包与压缩命令详解 在 Ubuntu 系统中,打包和压缩文件是常见的操作。通过打包和压缩,可以将多个文件或目录合并为一个文件,并减小文件大小以节省存储空间或方便传输。本文将详细介绍 Ubuntu 中常用的打包与压缩命令及其用法。 目录…

Linux-Ansible模块扩展

文章目录 Archive UnarchiveSetup模块Lineinfile Replace 🏡作者主页:点击! 🤖Linux专栏:点击! ⏰️创作时间:2025年02月23日18点11分 Archive Unarchive Archive和Unarchive模块 需求&#x…

剖析IO原理和零拷贝机制

目录 1 Linux的五种IO模型1.1 模型调用的函数1.1.1 recv函数1.1.2 select函数1.1.3 poll函数1.1.4 epoll函数1.1.5 sigaction函数 1.2 IO模型1.2.1 阻塞IO模型1.2.2 非阻塞IO模型1.2.3 IO复用模型1.2.4 信号驱动IO模型1.2.5 异步IO模型1.2.6 IO模型比较 2 Java的BIO、NIO、AIO2…

054 redisson

文章目录 使用Redisson演示可重入锁读写锁信号量闭锁获取三级分类redisson分布式锁 package com.xd.cubemall.product.config;import org.redisson.Redisson; import org.redisson.api.RedissonClient; import org.redisson.config.Config; import org.springframework.context…

TCP初始化序列号为什么要不一样

区分不同的连接(包括一些历史连接)、确保数据的顺序性、防止重放攻击(时间戳) 初始化序列号 ISN M F(localhost, localport, remotehost, remoteport)。 M是一个32位的计时器,这个计时器每隔 4 微秒加1,循环一次4.55小时F 是一…