网易有道开源知识库问答引擎QAnything,实现本地部署与多格式文档问答
1月16日消息,网易有道公司今日宣布,其自主研发的知识库问答引擎QAnything已经正式开源,并可在Github开源社区免费下载。这一引擎不仅支持云端大模型服务调用,同时还能实现纯本地部署。
据悉,QAnything的部署过程极为简便,仅需一键操作即可投入使用。该系统兼容多种文档格式,如Word、PPT、Excel、PDF以及图片等,用户可将这些文档直接导入系统,并体验与“ChatGPT”类似的问答功能。为确保最佳性能,官方推荐使用配置为RTX 3090或更高级别的电脑进行本地部署。
QAnything的核心技术基于检索增强的生成(Retrieval Augmented Generation,简称RAG)框架。这一框架通过检索外部内容的方式,有效提升了大语言模型在准确性、专业性和个性化等方面的表现。
网易有道指出,虽然通用大模型具备强大的能力,但却无法利用用户的私有数据,且存在产生虚构信息的风险。而QAnything则巧妙结合了用户私有数据与大模型的优势,能够将用户拥有的各种内容,无论其存在形式如何,如文档、音频、数据库等,都转化为可通过问答方式使用的知识资源。这一技术框架使用户能够便捷地构建自己的智能知识助手,实现“万物皆可问”的目标。
此次开源的QAnything是一套完整的RAG系统,包含了优化后的自研embedding和rerank模型、经过微调的大型语言模型(LLM)、优化后的推理代码、向量数据库以及一个即用型前端。整套系统算法模型(包括7B大模型、embedding/rerank及OCR)的显存占用不超过16GB。
据了解,QAnything已经在网易有道的多个产品中得到了应用,包括有道翻译文档问答、有道速读以及有道内部业务的客服系统等,展现出了广泛的应用前景和实用价值。