api-for-open-llm/docs/RAG.md at master · xusenlinzy/api-for-open-llm

Name: api-for-open-llm/docs/RAG.md at master · xusenlinzy/api-for-open-llm · GitHub
Rating: 4.8 (6093 reviews)

RAG

环境变量配置示例

PORT=8000 # llm related MODEL_NAME=qwen2 PROMPT_NAME=qwen2 MODEL_PATH=Qwen/Qwen1.5-14B-Chat-GPTQ # rag model related EMBEDDING_NAME=maidalun1020/bce-embedding-base_v1 RERANK_NAME=maidalun1020/bce-reranker-base_v1 # vllm related ENGINE=vllm TOKENIZE_MODE=auto GPU_MEMORY_UTILIZATION=0.8 TENSOR_PARALLEL_SIZE=1 DTYPE=auto TASKS=llm,rag

TASK 参数解释：

llm 表示启动对话大模型，rag 表示启动文档文档相关接口，比如embedding、rerank

快速体验

启动模型服务之后

cd streamlit-demo

修改 .env 文件中的以下两个变量

CHAT_API_BASE # 聊天接口地址 EMBEDDING_API_BASE # 嵌入模型接口地址（可选）

启动前端

streamlit run streamlit_app.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

RAG.md

RAG.md

RAG

环境变量配置示例

相关接口说明文档

快速体验

Files

RAG.md

Latest commit

History

RAG.md

File metadata and controls

RAG

环境变量配置示例

相关接口说明文档

快速体验