職位描述
工作內容:1、基于transformer的視頻任務推進(可能如****Recognition、Temporal****Detection、VideoCaptioning、video-LLM、LongVideoUnderstanding等)2、視頻foundation預訓練模型調研和推進任職要求:1、熟悉CNN基礎模型,transformer基礎模型(如resnet、vit、clip等)2、了解視頻相關的基礎任務、基礎開源數據等3、碩士研究生以上學歷,計算數學、模式識別、圖像處理、多媒體技術等專業方向4、熟練掌握pytorch深度學習平臺5、熟悉圖像處理、模式識別算法,熟悉了解OpenCV、decord、CvCuda等圖像處理平臺6、熟悉Linux平臺下腳本程序Shell、Python等,并能解決實際問題,可以針對數據清洗、數據標注靈活定制開發相關工具7、積極主動、性格開朗,樂于接受挑戰,具有主動學習能力。
企業介紹
格靈深瞳是一家行業領先的人工智能公司,專注于將先進的計算機視覺技術、大數據分析技術、機器人和人機交互技術與應用場景深度融合,提供面向智慧金融、城市管理、商業零售、軌交運維、體育健康、元宇宙等領域的人工智能產品及解決方案。公司成立于 2013 年,2022年3月在上海證券交易所科創板掛牌上市,成為A股第一家AI計算機視覺上市公司。