ssbc BT搜索引擎-电子发烧友网

这是 www.shousibaocai.org 的网站源代码。开源的目的是为了促进技术交流和相互学习，把DHT与搜索引擎技术应用到更广泛的领域去。

本站于2015年5月使用django改写。本站于2019年使用nodejs改写。与爬虫相关的代码都在目录spider目录下。

作为最早在国内研究和实践DHT爬虫的人，我的灵感是来自芬兰Helsinki大学的这篇论文： Real-World Sybil Attacks in BitTorrent Mainline DHT 英文好的同学应该很容易读懂，跟我写的不到300行的爬虫代码大致原理一样。初次接触DHT网络的可以结合我之前的文章阅读，或者拜读Kevin Lynx的博客。所以具体原理在这里就不再阐述了。

手撕包菜一开始只是为了纯粹的技术研究，没有去想这个搜索引擎能给网民带来什么样的福利。当时采集了大量的数据，发现有一半以上的资源为限级内容，于是试图去对资源进行分类并且做了很多这方面的工作。譬如，基本上能通过一套规则能筛选出限级内容，对资源进行分类，如果是视频还能匹配出是哪一部影片。可惜，这些工作我主观上认为对生活应用并没有太大价值，于是就放弃了深入的研究。或许是因为网民使用此类搜索引擎大部分都是具有明显的目的性。

手撕包菜经历了多次点技术变更

开源版本使用了django网站框架重写，之前是Flask，再早期是tornado。电影FM也是使用tornado，后来发现tornado并不适用于任何场景。以内容为王的网站还是django比较擅长，只是入门时间比其他框架都较长。早期数据库采用了MongoDB，因为配合Python读写数据很方便，也不用关注数据结构，搜索功能采用自带的关键词搜索，不过后来随着资源数量增加，性能也明显跟不上。今年换了WiredTiger引擎，自带的fulltext search还是不给力。另外Amazon的cloudsearch是个坑，土豪可以考虑，性能真的很不错，就是比较贵。最后还是搭建一个SphinxSearch吧，数据库也换成MySQL（MyISAM引擎），配合起来也很方便。Sphinx创建全文索引的速度很给力，官方的自评也很高，我自己测试1000w的资源（大概3GB），1分钟左右就索引完毕。不信，大家可以自测一下。

ssbc BT搜索引擎

软件简介

FPGA加速视觉搜索引擎解决方案

双向可控硅bt131-bt131可控硅管脚及参数

超强的ChatGPT会成为下一代搜索引擎吗

ChatGPT能否成为下一代搜索引擎

Typesense搜索引擎

Vald分布式矢量搜索引擎

BT3C扫频仪电路图纸下载

基于POI分布的空间索引结构TDG

基于最优排序的局部敏感哈希索引方案

面向社交媒体的高质量文章内容识别方法

基于MapReduce的时间序列索引及数据查询

基于蜕变测试的用户搜索引擎性能分析

基于改进和声搜索算法的深度置信网络模型

可提高隐私数据安全性的可搜索加密方案

面向社交媒体的高质量文章内容识别模型

搜索结果多样化及其算法综述

可智能无线传输的蓝牙模块BT04规格说明书

基于Unity3D游戏引擎的神经反馈治疗系统

一种结合属性信息的二分网络表示学习方法

Ubuntu的入门指南详细概述

结合时间和空间数据的移动对象数据索引PM-tree

结合搜索与Double DQN的非完备信息博弈算法

采用多目标蚁群优化算法的主题爬虫方法

以进化算法为搜索策略实现神经架构搜索的方法

一种数据流内存索引及存储方法

基于多标签策略进行答案搜索的CKBQA系统

C语言实现最简单的三层架构实例教程

面向差异化搜索背景的查询推荐方法详细说明

终极算法机器学习和人工智能如何重塑世界PDF电子书免费下载

什么是网络爬虫使用Python写网络爬虫的教程说明

Meta开发新搜索引擎，减少对谷歌和必应的依赖

OpenAI推出SearchGPT原型,正式向Google搜索引擎发起挑战

微软计划在搜索引擎Bing中引入AI摘要功能

OpenAI注册新域名，准备推出结合AI技术的搜索引擎挑战谷歌

OpenAI或将推出ChatGPT搜索引擎

生成式AI恐使搜索引擎衰退，预计2026年搜索量将下滑25%

谷歌搜索引擎优化的各个方面和步骤

Neeva宣布关闭其搜索引擎

使用Rust语言重写的代码搜索引擎黑鸟系统Blackbird正式启用

NAS下搭建linux命令搜索引擎教程

搜索引擎技术大战，始于昨日

ChatGPT能否取代Google、百度等传统搜索引擎

ChatGPT爆红，百度、搜狗、360等搜索引擎尴尬吗？

谷歌威胁将整个澳大利亚撤出其搜索引擎

苹果自研的搜索引擎干的过谷歌吗？

苹果正在加快研发自己的搜索引擎,以取代谷歌

中国搜索引擎市场规模已突破千亿元，百度引领国内发展

苹果正在开发iPhone的搜索引擎技术,挑战谷歌的垄断地位

谷歌每年向苹果支付数十亿美元,确保其是iPhone的默认搜索引擎

华为Mate40全球线上发布搜索引擎和地图应用

靠搜索引擎发家的谷歌，或被美国盯上采取法律行动

2020年华为开发者大会快讯：华为搜索引擎基于移动云搜索 面向移动终端用户

Apple将在不久的将来启动搜索引擎

中国搜索引擎增速放缓，移动搜索成为搜索企业未来新的增长点

2020上半年国内搜索引擎数据出炉，百度斩获双第一

DuckDuckGo搜索引擎采用了新的简约设计

Verizon推出新型搜索引擎OneSearch，以保障用户信息安全

Verizon Media发布一款的隐私搜索引擎 将不会利用cookie对用户进行追踪

大数据是如何优化企业搜索引擎

区块链技术打造的区块链搜索引擎和资讯服务平台Bee360介绍

下载排行榜

瑞芯微RK3588系列开发板-产品资料更新-2026.06

ZS73XGaN 高性能 PWM+D-GaN 芯片数据手册

OK3506-S12 Mini开发板产品资料-2025.10

FS4054H 输入电压范围3.8V~6.8V 输入最大耐压28V 输入过压关闭充电阈值6.8V

LZC9300A 高性能恒压恒流碳化硅驱动控制芯片

ZS7606XY同步整流使用规格书

2020年华为开发者大会快讯：华为搜索引擎基于移动云搜索面向移动终端用户

Verizon Media发布一款的隐私搜索引擎将不会利用cookie对用户进行追踪