会员登录 立即注册

搜索

构建中国人自己的私人GPT—与文档对话

[复制链接]
崎山小鹿 发表于 2024-1-24 16:48:34 | 显示全部楼层 |阅读模式
崎山小鹿
2024-1-24 16:48:34 1756 0 看全部
先看效果
微信图片_20240124165426.png
他可以从上传的文件中提取内容作为答案。

上传一个文件“en.txt”,文件内容为:
who are you
I am a large model trained by Jinshuangshi Technology Company.

whoareyou0.png
系统自动将文件向量化
上传文件.png

测试提问:
whoareyou.png

whoareyou2.png

英文的表现还是不错的
hi.png

要支持中文需要解决三个问题:
1.识别中文文件
2.解析中文问题
3.用中文回答问题

加我微信:qishanxiaolu
解决之后同时支持中英文,如下:
ch.png


上传文件摄取速度
摄取速度取决于您正在摄取的文档数量以及每个文档的大小。为了加快摄取速度,您可以在配置中更改摄取模式。
存在以下摄取模式:

simple:历史行为,一次按顺序摄取一份文档
batch:使用批量读取、解析和嵌入多个文档(批量读取,然后批量解析,然后批量嵌入)
parallel:并行读取、解析和嵌入多个文档。这是本地设置最快的摄取模式。要更改摄取模式,您可以使用embedding.ingest_mode配置值。默认值为simple。
要配置用于并行或批量摄取的工作线程数量,您可以使用embedding.count_workers配置值。如果将此值设置得太高,可能会耗尽内存,因此设置此值时请务必小心。默认值为2。对于batch模式,您可以轻松地将此值设置为 CPU 上可用的线程数,而不会耗尽内存。对于parallel模式,您应该更加小心,并将该值设置为较低的值。

对于想要对硬件施加更多压力的用户来说,以下配置应该足够了:

embedding:
  ingest_mode: parallel
  count_workers: 4

如果您的硬件足够强大,并且您正在加载大量文档,则可以增加工作人员的数量。建议您自己进行测试以找到适合您的硬件的最佳值。

支持的文件格式
privateGPT 默认支持所有包含明文的文件格式(例如,.txt文件.html等)。然而,这些基于文本的文件格式仅被视为文本文件,并且不以任何其他方式进行预处理。

它还支持以下文件格式:

.hwp
.pdf
.docx
.pptx
.ppt
.pptm
.jpg
.png
.jpeg
.mp3
.mp4
.csv
.epub
.md
.mbox
.ipynb
.json
请注意以下细微差别:虽然privateGPT支持这些文件格式,但可能需要在 python 虚拟环境中安装额外的依赖项。例如,如果您尝试提取.epub文件,privateGPT可能会失败,而是会显示一条解释性错误,要求您下载安装此文件格式所需的依赖项。

其他文件格式也可能有效,但它们将被视为纯文本文件(换句话说,它们将作为.txt文件被摄取)。

重置本地文档数据库
在本地设置中运行时,您只需删除local_data文件夹的所有内容(.gitignore 除外)即可删除所有摄取的文档

参考:https://docs.privategpt.dev/manual/document-management/ingestion
回复

使用道具 举报

  • 您可能感兴趣
  • 生成身临其境的环境模型
    生成身临其境的环境模型
    清华大学创作的AI软件 aiuni Aiuni.ai是一个基于Unique3D的在线AI图片转3D模型生成建
    09-07
  • 站长日记-天道与畜生道
    站长日记-天道与畜生道
    天道无情,但众生平等,无为却处处体现博爱。畜生道有情,讲的是尊卑次序只为繁衍,处
    06-20
  • 墨者的几个阶段
    墨者的几个阶段
    一、知毛泽东,不知有墨子。 二、知墨子,但依然儒法道行事。 三、知墨子,尝试墨家
    08-31
  • 图生产3D模型
    图生产3D模型
    https://hyperhuman.deemos.com/ 上传图片,点击生成 可以多生成几次,点击应用
    08-30
  • 如何给3D人物换衣服CC4
    如何给3D人物换衣服CC4
    1.导入人物 2.设置人物Apose 3.导入衣服 create -> accessory 选择fbx文件 设置
    08-30
您需要登录后才可以回帖 登录 | 立即注册 |

本版积分规则 返回列表

查看:1756 | 回复:0

  • 生成身临其境的环境模型

    清华大学创作的AI软件 aiuni Aiuni.ai是一个基于Unique3D的在线AI图片转3D模型生成建

    阅读:28|2024-09-07
  • 墨者的几个阶段

    一、知毛泽东,不知有墨子。 二、知墨子,但依然儒法道行事。 三、知墨子,尝试墨家

    阅读:279|2024-08-31
  • 图生产3D模型

    https://hyperhuman.deemos.com/ 上传图片,点击生成 可以多生成几次,点击应用

    阅读:254|2024-08-30
  • 如何给3D人物换衣服CC4

    1.导入人物 2.设置人物Apose 3.导入衣服 create -> accessory 选择fbx文件 设置

    阅读:245|2024-08-30
  • 墨子平台总设计师

    相濡以墨,用墨子思想重塑商业,以商助墨,以墨韵商。商品把关,营销把关,职务把关

    阅读:228|2024-08-29
  • 招聘AI模型训练师

    训练人物模型,对换脸技术有研究。

    阅读:201|2024-08-29
  • 墨家商品联盟

    大家好,我是相濡以墨,我是墨子的忠实粉丝,现在墨家的朋友越来越多,很多墨家人多才

    阅读:230|2024-08-29
  • 精彩人工智能影视分享

    精彩人工智能影视分享 通过百度网盘分享的文件:AI影视 链接:https://pan.baidu.com

    阅读:276|2024-08-28
  • 墨子从两千年的沉睡中醒来

    大家好,我是墨翟,就是你们后世称之为的墨子,我突然从战国时代的沉睡中苏醒,置身于

    阅读:301|2024-08-24
  • 机器人模型制作

    使用图片 关键词: 未来人机合体,科幻,真人头部,头部以下是机器身体,身体透明外

    阅读:294|2024-08-22
金双石科技,软件开发20年,技术行业领先,您的满意,就是我们的目标,认真负责,开拓进取,让成品物超所值
关于我们
公司简介
发展历程
联系我们
本站站务
友情链接
新手指南
内容审核
商家合作
广告合作
商家入驻
新闻合作

手机APP

官方微博

官方微信

联系电话:15876572365 地址:深圳市宝安区西乡街道宝民二路宝民花园 ( 粤ICP备2021100124号-1 ) 邮箱:qishanxiaolu@qq.com
QQ|Powered by Discuz! X3.5 © 2001-2024 Discuz! Team.
快速回复 返回顶部 返回列表