这是一份kallydev/privacy项目的搭建指南,用于查询8亿QQ手机绑定数据。此项目仅用于查询个人信息泄露情况,请勿用于非法目的。
秉持能用就行的原则,文中的代码可能涉及权限配置问题,敬请注意。

此外,如果只是想直接搜索大文件,可以试试ripgrep软件。

安装WSL

我是在Windows平台搭建此项目的。如果有原生Linux服务器那再好不过,请跳过本段。
WSL即Windows Subsystem for Linux,能够在Windows 10上直接跑一个Linux。(除非你在WSL里下载裤子,否则)因为涉及到Windows与WSL的文件交换,所以安装WSL1比较方便。
WSL安装教程
安装WSL1仅需第1、6、7步。我选择的是Ubuntu 18.04 LTS。
记得预留出足够的C盘空间。建立索引后的数据库约为50GB。

导入数据

按照使用教程处理数据。可以先做这一部分,因为仅导入数据就要约1小时。

导入脚本扫描完就可以看到,QQ库有719806832行,而JD库有141639667行。

由于我在Windows里操作数据库,JD库是UTF-8编码,跑导入脚本会以gbk方式读取导致乱码,所以在jd.py里要把两处读取命令“open(self.file_path)”改成:

open(self.file_path, encoding='utf-8', errors='ignore')

导入完JD库之后可以用这个命令看看是不是乱码:

sqlite3 database.db
//进入sqlite之后执行SQL语句,看看第一行的名字是不是乱码
SELECT * FROM jd LIMIT 1;

安装项目

//首先把软件源换了
sudo vi /etc/apt/sources.list
//在命令模式下替换文本
:%s/archive.ubuntu.com/mirrors.aliyun.com
:%s/security.ubuntu.com/mirrors.aliyun.com
//:wq保存文件
sudo apt-get update
//装依赖
sudo apt install npm
sudo npm install -g yarn
sudo add-apt-repository ppa:longsleep/golang-backports
sudo apt-get install golang-go
sudo npm install -g n
n stable
//编译前后端
git clone http://github.com/kallydev/privacy
cd ./privacy/website
yarn install
yarn build
cd ../server
go build -o app main/main.go
//启动
cp ../config.yaml config.yaml
vi config.yaml
//然后修改配置文件中数据库地址,电脑的磁盘是直接挂载在/mnt下的,注意路径中斜杠需要换方向
//将第二行path后面的数据库路径换成你数据库的路径,如:
/mnt/d/folder/database/database.db
//然后运行程序
sudo ./app --config config.yaml

这时打开localhost能看到网页已经跑起来了。

提醒:若要查看不打码的信息,请在config.yaml里把mask参数改为false。

2 对 “个人数据泄漏检测网站 - 搭建指南”的想法;

发表评论

邮箱地址不会被公开。