机器学习工程师 (生成式人工智能) (2023年1月 - Now)
- 主导生成人工智能模型的研究,包括 GAN(生成对抗网络)、VAE(变分自编码器)和扩散模型的先进技术。专注于实现高精度背景去除和图像美化领域的创新,利用这些模型为图像处理质量和效率树立新标准。
- 集成和定制的前沿模型,例如Stable Diffusion。具体来说,ControlNet 的实施发挥了至关重要的作用,因为它具有管理生成过程的杰出能力,显着提高了准确性和多功能性,从而实现了卓越的模型性能。
- 使用 PyTorch 来开发这些模型。对于生产环境的部署,利用TensorRT优化模型推理,确保高性能和高效率。
机器学习工程师(计算机视觉),TikTok(字节跳动)广告审核团队(2021 年 3 月 - 2023 年 1 月)
- 使用 PyTorch、OpenCV、C++、CUDA 和 TensorRT 开发并加速了 14 个图像/视频分类和检测模型,以识别在线广告中的高风险内容,重点拦截成人内容、吸烟和电子烟等敏感主题。
- 通过基于 Vision-Transformer 的模型(尤其是 CrossViT)的实验,模型精度提高了 3.6%,超越了传统 ResNet 系列模型的性能。
- 使用这些实施的模型每月有效过滤约 180 万张不当图像/视频,增强了用户和广告商体验。
机器学习工程师(计算机视觉),Momenta 研发团队(2020 年 7 月 - 2021 年 1 月)
- 使用 PyTorch 和 OpenCV,通过创新的注意力机制、残差连接、空洞卷积和优化器,将交通标志检测算法的精度提高了 2.1%,召回率提高了 3.6%。使用用于数据增强的 Albumentations 增强模型训练。
- 与跨职能团队合作,将先进的定位和分类模型纳入内部 RetinaNet 框架,提高其检测准确性和鲁棒性。成功地将这些模型部署在公司的汽车中作为ROS检测节点。
软件工程师、研发团队(2015年5月-2017年6月)
- 使用 C++ 开发了一个移动流量分析系统,涵盖 SS7、RAN、CS 部分和 LTE 协议,利用数据分析来分析错误、用户 ID、网络地址、元素 ID、时间指标和特定于协议的指标,以查明网络的根本原因问题。
- 通过实施提高处理速度DR 同时执行 20-40 个指标的策略。通过使用 SIMD 矢量化(特别是专为英特尔处理器定制的 AVX 集)进行广泛的并行化和优化来实现这一目标。利用各种数据结构和标准模板库(STL)来促进统计数据的实时聚合和分析,从每秒数十万个事件扩展到数百万个事件。
- 这项创新显着提高了移动运营商的服务质量和用户体验,实现了更全面的网络性能监控,包括拥塞、延迟、丢包、抖动和吞吐量等方面。