職位描述
崗位職責(zé)1、參與LLM推理服務(wù)框架分布式架構(gòu)設(shè)計(jì),關(guān)鍵技術(shù)驗(yàn)證,參與相關(guān)模塊的工程化實(shí)現(xiàn);2、參與大模型推理引擎的研發(fā)和優(yōu)化,包括推理系統(tǒng)優(yōu)化、模型量化壓縮和模型部署;3、參與LLM分布式推理的性能優(yōu)化,包括基礎(chǔ)設(shè)施系統(tǒng)優(yōu)化,綜合平衡算法效果和推理速度,加快算法迭代速度;任職條件1、本科及以上學(xué)歷,計(jì)算機(jī)相關(guān)專業(yè)優(yōu)先;2、3年以上軟件開(kāi)發(fā)經(jīng)驗(yàn),有推理引擎開(kāi)發(fā)經(jīng)驗(yàn),工程能力強(qiáng)的候選人優(yōu)先;3、熟悉主流的大模型推理框架Vllm/Sglang/TensorRT-LLM等;4、必須熟悉Python,有具有扎實(shí)的C++能力優(yōu)先,具有良好的編程習(xí)慣,熟悉Pytorch、Tensorfl ow等一個(gè)或多個(gè)深度學(xué)習(xí)框架開(kāi)發(fā);5、有大模型項(xiàng)目落地經(jīng)驗(yàn)優(yōu)先。
企業(yè)介紹
網(wǎng)宿科技(300017)成立于2000年,2009年于深交所創(chuàng)業(yè)板首批上市(300017),是全球化的信息基礎(chǔ)設(shè)施平臺(tái)服務(wù)提供商,業(yè)務(wù)遍及全球70多個(gè)國(guó)家和地區(qū)。公司始終致力于助力產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型升級(jí),滿足用戶隨時(shí)隨地、安全、可靠的數(shù)據(jù)處理及交互需求。公司專注于邊緣計(jì)算、云分發(fā)、云安全、云計(jì)算、云服務(wù)及綠色數(shù)據(jù)中心業(yè)務(wù),幫助企業(yè)技術(shù)創(chuàng)新實(shí)踐,是產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型升級(jí)值得信賴的合作伙伴。