聚焦 計算機視覺與多模態學習 方向,精通 PyTorch、TensorFlow 等主流深度學習框架,熟練應用 YOLO 系列、EfficientNet、BERT 等經典模型,在目標檢測、圖像增強、視覺語言融合等領域有深入研究。具備從算法研發到工程化落地的全鏈路能力,掌握模型訓練、超參數調優、推理性能優化等關鍵技術,同時了解邊緣設備與云端協同的部署方案,熟悉 Kubernetes 容器化部署流程。深耕學術研究與技術轉化,在醫學影像分析、罕見疾病圖像識別等細分領域有專項積累,發表多篇相關技術論文,具備將前沿學術成果轉化為教學案例的能力。
學員評價
項目經驗四足機器人研發項目:主導視覺識別與語音交互模塊開發,該項目為華清遠見核心實訓案例。基于 ESP32-S3 與 USB 攝像頭搭建硬件平臺,集成目標檢測算法與自然語言處理模型,實現 “視覺識別 - 語音指令 - 動作響應” 的閉環交互,支持 “握手”“跟隨” 等 10 + 語音指令,目標識別準確率達 95% 以上。醫療影像 AI 分析項目:參與膠質母細胞瘤術前 MRI 影像分析研究,基于病灶網絡映射技術構建生存時間預測模型,通過融合多模態影像特征與臨床數據,使預測誤差降低 12%,相關研究成果已形成學術論文發表。罕見圖像識別優化項目:提出 “提示反向學習” 技術方案,用于提升視覺語言模型對罕見圖像的識別能力。通過優化模型注意力機制與數據增強策略,在特定數據集上使識別準確率提升 8.3%,解決小眾場景下的數據稀疏問題。

