项目功能:数据爬虫

项目介绍:一个开源的网络搜刮 python 库,通过整合 LLM 和直接图逻辑,可自动创建网站和各种本地文档(XML、HTML、JSON 等)的搜刮管道。

只需指定需要提取的信息,即可自动提取,可通过接口(OpenAI、Groq、Azure、Gemini)或使用 Ollama 的本地模型来使用不同的 LLM。

项目特点:

单页面搜刮程序,只需要用户提示和输入源

从搜索引擎顶部 n 个搜索结果中提取信息的多页面搜刮工具

从网站上提取信息并生成音频文件的单页面搜刮器

项目地址:点击打开

image-nnnb.png