職位描述

職位描述:
1. 主導大模型系統架構設計:
負責RAG系統的整體架構設計,包括存儲層、檢索層、推理層與緩存層的技術選型與實現。
構建高可用、低延遲的分布式推理服務框架,支持向量數據庫集成(如Milvus、Elastic)、知識庫管理與多模態檢索優化。
設計并實現Agent工作流編排框架,支持工具調用(MCP協議)、任務規劃與自動化執行。
2.模型部署與性能優化:
負責大模型(LLM/VLM)的本地化部署、量化壓縮、動態批處理與推理加速,優化GPU/CPU異構算力利用率。
3. AI服務平臺開發:
基于Java/Go/Python構建高并發、可擴展的AI微服務,與現有業務系統深度集成,實現模型訓練-部署-監控的全鏈路管理。
4.技術領導與跨團隊協作:
指導中級工程師,制定技術方案,并主導技術攻關。與產品、算法、基礎設施團隊協作,定義需求并推動工程落地。
職位要求:
1.計算機科學、人工智能或相關領域本科及以上學歷,5年以上大型服務端開發經驗,3年以上AI系統相關項目經驗
2.有牽頭大型AI工程項目經驗,具備一定的團隊管理或技術領導經驗
3. 具備扎實的 Java 編程基礎,熟悉常用的 Java 開發框架,包括不限于Spring,SpringMvc、SpringBoot、Spring Cloud,有高并發分布式系統開發經驗
4. 熟悉常用數據庫,包括不限于Mysql、MongoDB、ES、Redis等,熟悉常用的消息中間件
5. 熟悉python/GO開發語言,能進行一般的python/Go項目開發
6. 能夠快速理解業務需求,具備良好的溝通能力,將業務需求準確轉化為技術方案
7. 善于學習和總結,有團隊合作精神和較強執行力,較強的問題解決能力、跨團隊溝通能力和技術規劃能力。
【加分項】
?1. 精通Transformer架構、RAG技術棧、向量數據庫優化與多模態檢索策略者優先。
?2. 掌握vLLM/SGLang/TensorRT-LLM推理框架中至少一種模型部署方法,掌握模型量化、算子融合、投機采樣等優化技術者優先。
3. 對AI技術前沿(如Agent、多模態)有持續跟蹤熱情者優先。
工作地點
地址:武漢洪山區武漢-洪山區小米武漢總部武漢小米總部


職位發布者
hrHR
小米科技有限責任公司


-
通信/電信/網絡設備/增值服務
-
1000人以上
-
私營·民營企業
-
北京市海淀區清河中街68號華潤五彩城寫字樓