免费观看又色又爽又湿的视频软件,在线点播亚洲日韩国产欧美,久久偷看各类wc女厕嘘嘘偷窃,偷窥 亚洲 另类 图片 熟女 ,色一情一乱一伦一区二区三区,岛国精品一区免费视频在线观看,国产欧美日韩精品第一,日本午夜一区二区视频,亚洲精品久久久久久中文字幕,在熟睡夫面前侵犯我在线播放

您當前的位置: 首頁 > 職位列表 > 職位詳情

AI推理算法工程師

1.5-3萬元/月
投遞簡歷
北京-豐臺區
3-5年
2026-05-11 15:02:24 更新 被瀏覽:536 次
唐人通信技術服務股份有限公司
最近在線時間:2026-05-11 15:02:24
電話:153********
地址:江西省南昌市南昌高新技術產業開發區創新三路1069號
職位描述

一.崗位職責
1. 參與智能家居場景下的大模型Agent系統設計與落地,打造涵蓋意圖理解、任務分解、多步邏輯推理、工具調用(ReAct)、記憶機制及個性化推薦的完整技術鏈路。
2. 采用SFT、強化學習等后訓練策略優化垂直領域模型,增強其在多階段推理、指令遵循、工具使用和專業問答方面的表現。
3. 基于實際業務反饋構建高質訓練樣本,設計獎勵機制與迭代優化方案,結合PPO/GRPO等算法建立強化學習驅動的模型演進路徑。
4. 關注大模型與智能體方向的國際最新進展(如多智能體協同、長上下文處理、思維鏈技術),推進前沿成果在智能家居場景中的實踐應用。
5. 深入洞察智能家居業務需求,提煉可復用、模塊化的算法能力,與產品和工程團隊高效協作,支撐業務持續迭代升級。

二.任職資格
1. 計算機、人工智能等相關專業本科及以上學歷,具備良好的數據結構與算法功底,擁有3年以上相關領域工作經驗。
2. 精通Python編程,熟練運用PyTorch等主流深度學習框架,具備規范的編碼習慣和扎實的工程實現能力。
3. 熟悉大語言模型完整訓練流程(包括預訓練、CPT、SFT、RLHF),掌握常用訓練與推理框架(如Megatron-LM、DeepSpeed、vLLM、Sglang等)。
4. 掌握強化學習基本原理,了解PPO、DPO、GRPO等核心算法,有基于RLVR框架進行強化學習訓練者優先考慮。
5. 具備敏銳的技術洞察力,能將先進算法與復雜業務場景融合,輸出具有實際業務價值的技術解決方案。
6. 擁有良好的團隊協作意識,工作主動性強,學習能力強,能夠快速驗證新思路并推動技術落地。

三.加分項
1. 主導過基于ReAct或Function Calling的Agent類生產項目開發。
2. 在大規模模型訓練中具備數據合成或強化學習實戰經驗。
3. 在開源社區發布過具備一定影響力的技術項目。

求職提醒:求職過程請勿繳納費用,謹防詐騙!若信息不實請舉報。
該公司的其他職位
產品經理(履約系統方向)
8000-13000元/月
江西-南昌
2026-05-12 15:03:23
投遞簡歷
通信工程主管
1-2萬元/月
江西-南昌
2026-05-12 15:02:26
投遞簡歷
后端開發工程師(JAVA)
1.2-2.4萬元/月
江西-南昌
2026-05-12 13:09:27
投遞簡歷
產品經理(履約業務)
1.2-2萬元/月
北京-豐臺區
2026-05-12 12:56:54
投遞簡歷
java開發工程師
8000-12000元/月
江西-南昌
2026-05-12 12:27:23
投遞簡歷
硬件產品策劃專員
1.5-3萬元/月
北京-豐臺區
2026-05-11 14:58:24
投遞簡歷
通信工程主管
1-2萬元/月
廣東-深圳
2026-05-11 14:55:23
投遞簡歷
測試工程師
1.1-2萬元/月
北京-豐臺區
2026-05-11 13:53:24
投遞簡歷
產品運營經理
1.5-3萬元/月
北京-豐臺區
2026-05-11 12:48:24
投遞簡歷
產品設計師
1.5-2萬元/月
北京-豐臺區
2026-05-10 15:09:19
投遞簡歷
您可能感興趣的職位 搜索更多相似職位 >
推薦企業 職位專題
唐人通信技術服務股份有限公司
公司主頁 >
微信求職找工作
手機掃一掃
手機掃一掃
隨時隨地找工作

海量高薪崗位在線免費直招 招聘者/求職者電話直聊

微信小程序
手機也能找工作