You are on page 1of 1

92b164b56ec897501XFy0tm1E1JSw5G9VvmcQOI~

姓 名 王一川 学 校 上海交通大学
性 别 男 专 业 应用统计
出生年月 2001.01 手机/微信 18955061273
Github https://github.com/wyyccc 邮 箱 grey_wang@sjtu.edu.cn

教育背景
华东师范大学 统计学 本科 2018.09 - 2022.06
专业成绩: 3.62/4(前 15%,主修科目:数学分析、高等代数、概率论、数理统计、数值分析、统计学习)

92b164b56ec897501XFy0tm1E1JSw5G9VvmcQOI~
所获荣誉: 一等奖学金、华东师范大学优秀学生、全国大学生数学竞赛三等奖、美国大学生数学建模竞赛 Finalist(特等奖提名)

上海交通大学 应用统计 硕士 2022.09 - 2024.06


专业成绩: 3.91/4(前 10%,主修科目:数理金融、数据挖掘、回归分析、应用多元统计分析、应用时间序列分析)

项目经历

Kaggle - NLP 文本多分类竞赛 铜牌(前 7%) 2022.06 - 2022.08


任务:对给定的论文中的每个段落进行分类,判断段落是否论证充分(三标签分类)。
解决方案:基于 5 折交叉验证构建多个基模型(Seq-level、Token-level),并进行多方面的优化,包括:调参、更换不同骨干网
络(Roberta、Deberta)、模型结构优化(池化、Multi-Dropout、Bigbird)、训练优化(FGM、PGD、EMA)等,此外还尝
试了数据增强、更换下游网络(textCNN)、构建文本统计特征的分类模型(LGBM)等,最终加权融合几个表现较好的基模型得
到最终输出。

实习经历
拼多多 算法实习生 TEMU 市场活动 2023.06 - 2023.09
 负责拉新场景下任务派发模型的迭代开发和因果推断方向的优化,采用了表征解耦、协变量学习、生成式方法等技术手段,
在业务场景实践了反事实估计和因果效应估计模型(CFRNet、DRCFR、CEVAE);
 对组内推荐系统存在的问题进行调研,具体进行了位置纠偏、MLP 改进、不平衡二分类任务、多任务学习等方向的调研,并
将调研成果融入现有业务框架中(PAL、FinalMLP、AutoEncoder、重采样、Adatask);
 跟踪业界最新工作成果,结合现有业务体系进行适应化改造(PLE、PEPNet、JRC)。
星环科技 算法实习生 应用创新部 2023.02 - 2023.06

 独立搭建金融风控服务,提供历史回测和实时新闻流监控接口,实现多进程、异步等功能(Flask、Thread);
 参与大规模金融服务搭建,负责文本模型训练、部署和推断接口服务构建(文本分类、情感分类);
 调研并改进 NER 方法(基于序列标注、UIE、W2NER 等方法的微调与优化,NER 准确率较先前模型提升超过 5%);
 参与大型语言模型微调落地项目,主要负责数据收集、数据增强、模型训练(LLama、BELLE、Self-instruction、LoRA);
 参与私有知识库(矢量数据库)搭建前期准备工作,实践知识库与大语言模型的结合应用(Langchain)。
十露盘科技 算法实习生 海外风控部 2022.09 - 2023.01
 训练并部署 NLP 短信多分类模型(特征工程、伪标签半监督学习、Flask;综合召回率由 90%提升至超过 95%);
 从海量用户信息中挖掘多个风控特征(DCN、文本聚类、文本分类;所挖掘的特征 iv 值均在 0.05 以上);
 利用多层次建模策略优化风控分类模型(XGB、随机森林、Stacking;模型 ks 值由 0.24 提升至 0.26 以上)。

专业技能
 英语六级 527 分,能够流畅阅读英文文献,熟练使用 AI 工具辅助工作,擅长快速实现开源方案。
 精通 Python、R 语言,熟悉 C++、Matlab,具备 Linux 系统服务器操作能力,能够编写 SQL 满足实际需求。
 Python 实践经验丰富,熟练使用深度学习模块(Pytorch、Tensorflow)、工程类模块(Flask、Docker)等。
 掌握数据挖掘、机器学习算法原理及应用,深度学习建模经验丰富,在 NLP、推荐营销等领域有过项目实践。
 具备良好的业务 sense,参与过多个领域的算法模型落地项目,对多种业务场景有实践经验。

You might also like