From 25fd86dfab8a14483caed9b4a134904d219eab34 Mon Sep 17 00:00:00 2001 From: 8ga Date: Fri, 1 Aug 2025 09:59:47 +0800 Subject: [PATCH] =?UTF-8?q?=E6=9B=B4=E6=96=B0=20README.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 27 ++++++++++++++++----------- 1 file changed, 16 insertions(+), 11 deletions(-) diff --git a/README.md b/README.md index ad21dbb..e68b94a 100644 --- a/README.md +++ b/README.md @@ -8,7 +8,7 @@ | 公司名称 | 入职日期 | 离职日期 | 所在地 | |:-----|:-----|:-----|:-----| -| 合肥统旭智慧科技有限公司 | 2025/04 | 2025/06 | 合肥 | +| 合肥统旭智慧科技有限公司 | 2025/04 | 2025/07 | 合肥 | | 极氪智能科技 | 2023/07 | 2025/03 | 杭州 | | 江苏普飞科特信息科技有限公司 | 2019/07 | 2023/05 | 成都 | | 上海柏维信息技术有限公司 | 2017/05 | 2019/06 | 上海 | @@ -17,7 +17,9 @@ | 技能点 | 掌握程度 | 补充 | |:-----|:-----|:-----| -| Spring AI | 熟练 | 能快速搭建一个AI大模型知识库、AI Agent 应用开发 | +| LLM | 熟悉 | Prompt、RAG、Tools/Function Calling、MCP、AI Agent | +| Spring AI | 熟悉 | ChatModel、EmbeddingModel、VectorStore、ChatClient、QuestionAnswerAdvisor、Function Calling、Structured Output | +| LangChain4J | 熟悉 | ChatModel、StreamingChatModel、EmbeddingModel、EmbeddingStore、@Tool、ScoringModel、WebSearchTool | | MySQL | 熟练 | B+Tree、MVCC | | ShardingJDBC | 熟练 | 分库分表、动态数据源、多租户数据源 | | Redis | 熟练 | 分布式缓存、分布式锁(Redisson)| @@ -32,18 +34,21 @@ # 项目经验 -### AI 数字人 +### 数字人 -该项目是一个基于语音交互的数字人应用,私有化部署AI大模型,结合本地私域知识库,实现私域知识问答、导览服务。 +基于语音交互(ASR+TTS)结合LLM以及私域知识库,实现问答和聊天服务。 -- 职位:Java开发、项目经理 -- 技术栈:Spring AI、ES(向量数据库)、JAVA 21、阿里百炼大模型平台 +- 职位:Java开发 +- 技术栈:Spring AI、JAVA 21、Ollama、百炼大模型 - 工作内容: - - 购买合适的硬件(主要是显卡)组装主机、安装操作系统(Ubuntu 22.04 LTS) - - 安装驱动包,Nvdia 显卡驱动、Docker、Nvdia Container Toolkit,为 Docker 配置 Nvdia 运行环境 - - 安装 AI 大模型运行环境,GPUStack、Xinference、Ollama - - 安装 AI 大模型,deepseek-r1:7B、14B、32B,qwen2.5:14B,Qwen3:8B - - 使用 Spring AI 整合本地部署的模型API、阿里百炼大模型API、本地的嵌入模型、本地的向量数据库、本地的重排序模型,搭建一套知识库应用与 AI Agent 开发 + - 购买显卡组装主机,安装 Ubuntu 和 Docker + - 安装 Nvidia 显卡驱动、Nvidia Container Toolkit、为 Docker 添加 GPU 运行环境 + - 部署聊天模型:Ollama + Qwen3:8B + - 部署嵌入模型:GPUStack + bge-m3,Xinference 每次重启无法重新拉起模型所以选择了GPUStack + - 部署重排序模型:GPUStack + bce-reranker-base-v1 + - 部署向量数据库:Elasticsearch + - 使用 Spring AI 框架整合LLM和ES,通过 Prompt 和 RAG 实现一个私域知识库聊天和问答服务 + - 配合安卓开发做技术选型,如ASR和TTS以及数字人 ### VIDP(整车集成开发平台)