Dify体验
前文 ollama:极简本地化部署LLM 有提到本地化部署Ollama + Open-webui,但是作为RAG和Agent的能力还是很弱。这次看看结合Dify能有什么样的碰撞。Dify是一个易用的 LLMOps 平台,旨在让更多人可以创建可持续运营...
GonFreecss
0
ollama:极简本地化部署LLM
主要是更方便简捷的方式运行大模型,无需GPU资源。mac、linux和win的版本都有。我是基于win去玩,在官网下载exe安装包。安装好后,默认就给你启起来,command也很简约 直接run的时候,如果没有本地模型,就去pul...
GonFreecss
0
NVIDIA Chat With RTX(1)——TensorRT-LLM
Demo介绍:将自定义资料(文档、笔记、视频或其他数据)与LLM建立连接,从而令 LLM 更具个性化。支持多种文件格式,包括文本文件、pdf、doc/docx 和 xml。只需在该应用中指定包含目标文件的文件夹,该应用便会在几秒...
GonFreecss
0
关键信息抽取【2】——体验篇
基本原理可以先看下文 Damon,公众号:人工智障与神经病网络研究所关键信息抽取【1】——初识篇 1. 环境准备 Python版本:3.10.12 硬件:win11,CPU # 构建Conda虚拟环境conda create --name py310_paddle python=3.10...
GonFreecss
0
Transformer-XL 2019.06
《Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context》 https://arxiv.org/pdf/1901.02860.pdf 2019年6月 卡内基梅隆大学、谷歌 基础知识 1. 背景 RNNs很难优化,因为存在梯度消失和梯度爆...
GonFreecss
0
PP-Structure简介
PP-Structure pp-Structure整体包括三个方面:版面分析(layout analysis)、表格识别(table recognition)和关键信息抽取(key information extraction) 1. 版面分析 版面分析指的是对图片形式的文档进行区域划分...
GonFreecss
0