工作职责
1. 负责大模型的训练和迭代,包括数据清洗、微调、测试;
2. 结合业务场景微调大模型,提高模型在特定任务上的效果;
3. 负责多模态基座大模型的训练和迭代,包括数据清洗、微调、测试;
4. 长期跟踪显示领域的具体场景与多模态大模型结合的业务场景;
任职资格
1.工作经验2年以上,具有自然语言处理、语音交互、计算机视觉或者深度学习相关专业,硕士以上学历;
2.具备扎实的LLM/MLLM相关理论知识,熟悉大模型的微调(Lora)、增量预训练、对齐以及部署加速等相关知识,具备实操能力;
3.熟悉BERT/llama/qwen-vl/intern-vl等主流大模型,等熟悉Pytorch,DeepSpeed、Megatron主流的深度学习训练框架,熟悉常用的大模型加速推理框架(vLLM,TensorRT-LLM);
4.有基于大模型的RAG/ChatBI/代码生成落地应用项目开发经验者加分,有多模态大模型训练经验者加分;
5.了解基于大模型的多任务学习,跨领域任务学习经验者加优先。