简历模板3——数据挖掘工程师5年经验

姓名 / Your Name

数据挖掘工程师 | 5年经验 | 推荐/画像/反欺诈
📞 138-XXXX-XXXX | ✉️ your.email@example.com | 🌐 github.com/yourname | 📍 北京


🎯 个人简介 / Summary

5年大厂数据挖掘工程经验,硕士学历,主攻推荐系统、用户画像、图神经网络与反欺诈检测。擅长构建复杂特征体系、建模全流程和线上部署,主导多个核心项目实现业务增长与系统落地。具备强建模与工程结合能力,熟悉海量数据处理、模型服务化、AB实验机制等实战经验。


💼 工作经历 / Work Experience

高级数据挖掘工程师

字节跳动 | 推荐技术部门
2021.08 – 今,北京

  • 主导短视频推荐排序优化项目,设计 DeepFM+MMoE 多任务模型,引入短期兴趣建模,点击率提升 12.3%
  • 搭建用户画像系统,整合30+维度标签(兴趣簇、行为频次等),支撑推荐/广告/内容风控三大业务;
  • 建设异步特征平台,支持日均百亿调用,模型服务稳定性达99.99%;
  • 与平台协作完成多模型服务统一部署,接入AB实验与指标归因。

数据挖掘工程师

美团 | 风控与调度算法组
2018.07 – 2021.07,北京

  • 构建交易网络图用于识别虚假商户,引入图神经网络(GAT)建模多跳交易路径关系,识别准确率提升至 91%
  • 参与骑手调度系统建模,引入天气/订单密度/区域热度等特征,平均配送时间下降 8.5%
  • 搭建建模特征流水线与训练样本生成框架,提升建模迭代效率。

🚀 项目经历 / Key Projects

1. 多目标推荐排序模型优化(字节跳动)

  • 业务背景:短视频首页推荐场景中,既需提升 CTR,又需兼顾用户留存与观看时长;
  • 技术方案
    • 构建 DeepFM + MMoE 架构的多任务模型,主任务预测点击率,副任务建模停留时长与次日活跃;
    • 引入序列建模(Transformer)处理用户短期行为序列,建模兴趣漂移;
    • 利用曝光补权 + 多任务 loss 平衡点击与留存任务,缓解样本不均问题;
  • 成效:模型部署后 AB 实验点击率提升 12.3%,次日留存提升 4.7%,覆盖日活用户 2.1 亿+。

2. 用户画像图谱系统重构(字节跳动)

  • 业务背景:原有画像系统静态、碎片,难以刻画动态兴趣与跨域行为;
  • 技术方案
    • 基于用户-行为-内容构建异构图(Heterogeneous Graph),引入 GCN 聚类生成兴趣簇标签;
    • 结合行为频率、内容语义和交互上下文,构造 30+ 类标签体系;
    • 构建异步标签生成服务,支持分钟级更新,降低调用延迟;
  • 成效:画像体系被推荐、广告、内容安全三条业务线复用,调用量日均超 3 亿,支撑多模型输入特征。

3. 刷单团伙识别系统(美团)

  • 业务背景:平台存在大量虚假交易与团伙账号影响信用体系;
  • 技术方案
    • 构建商户-用户-订单的图结构,设计节点与边的复杂行为特征(频次/金额/时间窗口);
    • 引入图注意力网络(GAT),对商户关系图建模,识别社区行为特征;
    • 加入半监督图学习机制,利用人工标注样本传播可信度;
  • 成效:模型上线后识别准确率达 91.2%,月均拦截恶意商户 400+,有效减少平台投诉。

4. 用户流失预测与营销反激活系统(美团)

  • 业务背景:平台需要预测用户流失并提供精准触达机制;
  • 技术方案
    • 构建用户行为序列特征(7/14/30天粒度),使用 LightGBM 预测未来30天留存概率;
    • 结合时间窗内行为密度、支付周期与页面路径等构建高关联特征;
    • 支持营销策略 AB 测试与回溯优化,接入短信/Push/券包等激活链路;
  • 成效:模型 AUC 达 0.87,激活命中率提升 21%,次月留存提升 6.3%

🏆 竞赛经历 / Competitions & Awards

  • 🥈 Kaggle - Santander Customer Transaction Prediction:Top 2%,团队融合方案,使用堆叠模型与特征统计增强;
  • 🥉 阿里天池用户增长算法大赛 全国三等奖:建模方案基于用户行为频率与滑窗聚合;
  • 🎖️ 中国研究生数学建模竞赛 国家二等奖

🎓 教育背景 / Education

北京航空航天大学
硕士 | 计算机科学与技术 | 2016.09 – 2018.06

山东大学
学士 | 信息管理与信息系统 | 2012.09 – 2016.06


🧠 技能清单 / Skills

  • 建模算法:XGBoost, LightGBM, DeepFM, MMoE, Transformer, GNN(GAT/GCN)
  • 数据平台:Hive, Spark, Airflow, Flink, Kafka
  • 工程部署:Python, TensorFlow Serving, Faiss, Docker, Linux Shell
  • 应用领域:推荐系统、用户画像、反欺诈、调度预测、用户增长

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/910628.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【工具教程】批量PDF识别提取区域的内容重命名,将PDF指定区域位置的内容提取出来改名的注意事项

1、如何批量识别大量PDF的文字并重命名PDF文件可以参考具体操作步骤文章: 【工具教程】批量PDF识别提取区域的内容重命名,将PDF指定区域位置的内容提取出来改名的具体操作步骤-CSDN博客文章浏览阅读2次。在企业运营过程中,时常会面临处理海量…

轻量级密码算法PRESENT的C语言实现(无第三方库)

一、PRESENT算法介绍 PRESENT是一种超轻量级分组密码算法,由Bogdanov等人在2007年提出,专门为资源受限环境如RFID标签和传感器网络设计。该算法在硬件实现上仅需1570个门等效电路(GE),在保持较高安全性的同时实现了极小的硬件占用空间。PRES…

图数据库如何构筑 Web3 风控防线 | 聚焦批量注册与链上盗转

本文为悦数图数据库 Web3 场景风控系列文章的下篇,聚焦典型应用场景,如批量注册风控与链上交易风控,通过具体案例展示图数据库如何在实战中识别女巫攻击、羊毛党团伙、资金闭环洗钱等高危行为,帮助业务方构建更具前瞻性的防御机制…

基于边缘计算的丝杆状态实时监测系统设计?

基于边缘计算的丝杆状态实时监测系统设计,可从系统架构、各层功能设计、关键技术应用等方面入手,以下为详细介绍: 系统架构设计 基于边缘计算的丝杆状态实时监测系统通常由感知层、边缘层和云端三部分组成。感知层负责数据采集,…

【6S.081】Lab1 Xv6 and Unix utilities

配置xv6环境 参考这篇文章即可:环境配置 对于xv6的使用,更推荐用VSCode等文本编辑器进行启动,毕竟面对着命令提示符,还是太过寒酸了。 每次实验完成之后需要进行提交和测试,并且要新创一个time.txt文件告知完成时间。…

【Chipyard】修改Gemmini 中PE的数量

实战目标 PE数量扩大到原来4倍 原来配置 tileRows: Int 1,tileColumns: Int 1,meshRows: Int 16,meshColumns: Int 16, 改后配置 tileRows: Int 1,tileColumns: Int 1,meshRows: Int 32,meshColumns: Int 32, 修改配置 1. 修改gemmini的scala配置文件,用…

【论文阅读笔记】高光反射实时渲染新突破:3D Gaussian Splatting with Deferred Reflection 技术解析

文章目录 3D Gaussian Splatting with Deferred ReflectionInfoAbstractIntroductionMethod1.渲染模型2. Loss函数和Normal 梯度3. 训练 RESULTS AND EVALUATION1.和基线的比较 Ablation StudyLimitations总结思考 3D Gaussian Splatting with Deferred Reflection Info 会议 …

数据结构-为什么双指针法可以用来解决环形链表?-使用O(1)的空间复杂度去解决环形链表的思路

环形链表 前言一、环形链表二、代码实现三、证明当fast一次走两步,slow一次走一步时,相遇情况当fast一次走三步,slow一次走一步时,相遇情况当fast一次走四步,slow一次走一步时,相遇情况第一种:N…