
工作职责:
1. 设计与实现算法模型:负责机器学习、深度学习(如CNN、RNN、Transformer等)、自然语言处理(NLP)、计算机视觉等领域的算法研究与开发,根据业务需求选择合适的模型架构并进行优化。
2. 大模型与前沿技术探索:涉及大语言模型(LLM)的预训练、微调(如LoRA、Adapter技术)、提示工程(Prompt Engineering)等,推动生成式AI、大模型在军工领域、3D生成等场景的应用。
任职资格:
1. 编程语言:精通Python,熟悉C++/Java至少一种;熟练使用Shell/Linux环境;
2. 深度学习框架:熟练掌握PyTorch、TensorFlow、Keras等框架,熟悉分布式训练(如Horovod)、混合精度训练等技术;
3. 数据处理工具:熟悉SQL、Hadoop、Spark等大数据处理工具,掌握Pandas、NumPy等数据分析库;
4. 工程能力:了解Docker、Kubernetes等部署工具,熟悉Git版本控制与CI/CD流程。
5. 算法与模型:计算机视觉、NLP、熟悉Transformer架构,有LLM(如GPT、BERT)微调、Prompt Engineering、
6. 团队协作与沟通:需与多部门协作,将技术成果转化为非技术团队可理解的方案。
加分项:
1. 掌握实施AI编排工具项目经验者优先。