张瀚文

张瀚文

18983178571 644627286@qq.com 男 | 29岁 城市:重庆、上海
数据分析师 大模型工程师 数据运营

自我评价

具备计算机+金融复合背景,拥有4年金融大数据领域从业经验,精通数据全链路处理、风控建模、知识图谱搭建与大模型行业应用。主导/参与多个从0到1的政府及金融类数据项目,持有PMP认证,可独立完成需求对接、方案设计、落地交付全流程工作。责任心强,抗压能力突出,能够快速学习不同领域业务知识并转化为数据解决方案。业余热爱小提琴、羽毛球及高海拔徒步,具备良好的身体素质与意志品质。

专业技能

Python MySQL Neo4j NebulaGraph ElasticSearch Tableau RAG / LLM Prompt Engineering Wind iFind Tushare Openclaw

证书与荣誉

  • 证券从业资格
  • 基金从业资格
  • PMP(项目管理专业人士)
  • 2021年优秀实习生
  • C1驾驶证

教育背景

悉尼科技大学 (上海大学联合培养)
金融 | 硕士
2020.10 - 2022.05

主修课程:高级金融建模、公司金融、金融衍生品定价、量化投资分析、金融风险管理等核心课程。

奥本大学 (美国)
计算机科学 | 本科
2015.09 - 2020.05

主修课程:数据结构与算法、操作系统原理、计算机网络、软件建模与系统设计、统计学等。

工作经历

数据分析师 (金融)
北京大学重庆大数据研究院
2022.08 - 至今
  • 需求与方案设计:深入调研金融产业场景,参与产业链分析平台从0到1规划,完成功能设计、潜在客户挖掘,输出全套技术文档,主导/参与4项发明专利撰写,其中1项已获授权。
  • 数据全链路处理:完成多源数据源接入评估与质量校验,设计分布式处理方案完成亿级结构化/非结构化数据的解压、清洗、入库、全量更新,熟练使用Hive、MySQL、Redis、Elasticsearch、Neo4j、NebulaGraph等数据库。
  • 知识图谱构建:主导产业链知识图谱实体、关系规则设计与算法匹配方案,采用多线程导入技术将图谱数据落地Elasticsearch,累计覆盖127条全量产业链数据。
  • 风控建模落地:参与农业担保公司全链路风控体系建设,独立完成保中多场景评分卡模型开发,优化保后风险预警模型,输出全套技术开发与指标文档。
  • 大模型应用开发:参与大模型自动化报告生成系统建设,负责Prompt工程优化、向量数据库检索逻辑设计、FastAPI接口开发与联调,实现产业分析报告的结构化自动生成。

项目经历

某区产业综合服务平台
角色:数据分析师 + 项目管理
2026.04 - 至今

项目背景:针对重庆高新区产业服务数字化需求,整合多部门产业数据,搭建覆盖企业服务、金融扶持、产业链分析的一体化平台,服务区域十大重点产业招商与企业培育。

工作内容:主导项目整体进度规划,完成可演示HTML原型设计,梳理4个核心业务模块、3个用户端口的全部功能点,协调跨部门数据采集,输出标准化数据需求清单;负责金融服务板块核心设计,搭建企业多维度画像评估指标体系,设计产业链知识图谱数据模型,定义企业、产品、技术、政策等6类核心实体与12类关联关系。

项目成果:完成平台核心模块原型设计与数据标准制定,进入系统开发阶段,为后续区域产业链精准招商提供数据底座。

某传媒公司数据资产管理
角色:数据分析师 + 项目管理
2025.07 - 2026.01

项目背景:响应国家数据资产入表政策,完成传媒公司全量数据资产梳理、估值与合规申报,实现数据资产财务价值转化。

工作内容:主导项目全流程推进,梳理公司666张存量业务表的字段逻辑与关联关系,完成数据分层治理,最终沉淀26张高价值核心数据资产表;完成数据质量校验、安全等级评估与应用场景规划,输出全套符合北数交易所要求的申报交付物;协调北数交易所、律所、会计师事务所、资产评估机构四方进场,同步各方进度与需求,解决合规与技术问题。

项目成果:数据资产成功通过北数交易所审核,获得官方数据资产证书,完成数据资产财务入表全流程落地。

某银行大模型项目
角色:数据分析师 + 大模型工程师
2025.03 - 2025.09

项目背景:解决银行政策解读效率低、研报撰写成本高、信贷审批流程长等痛点,基于大模型搭建智能化业务辅助系统。

工作内容:深入梳理银行业务需求,将政策解读场景转化为RAG系统设计方案,将研报生成场景转化为结构化内容生成方案;基于通义千问Max搭建RAG系统,通过LoRA技术完成金融领域轻量级微调,构建文档处理流水线,支持PDF、Excel等多格式银行文档解析与结构化信息提取,政策解读准确率提升32%;负责产业分析报告自动化生成模块,采用思维链提示、Function Calling(本地数据获取与可视化)、Query生成与联网检索结合的技术方案,实现符合银行风格的定制化研报输出。

项目成果:系统辅助业务人员完成政策查询、研报生成、企业资质分析等工作,大幅缩短信贷审批流程,降低前台人员重复劳动成本。

某农业担保公司风控建模项目
角色:数据分析师
2023.12 - 2024.07

项目背景:改造农业担保传统人工审核模式,搭建保前、保中、保后全流程数字化风控体系,降低坏账率,提升审批效率。

工作内容:参与风控全流程建模框架设计,覆盖从用户申请到额度匹配的完整链路;独立完成保中3个核心评分卡模型从0到1开发,从1000+初始指标中筛选47个高区分度特征,模型KS值达到0.42;优化保后风险预警模型,识别准确率提升28%;配合甲方完成模型部署上线,输出全套技术开发文档与模型验证报告。

项目成果:累计交付20个风控模型与3套配套策略,实现担保业务全流程数字化覆盖,保后环节50%样本无需人工审核,整体审核效率提升60%,坏账率预计下降15%。

产业链知识图谱搭建
角色:数据分析师
2022.09 - 2024.04

项目背景:整合多源产业数据,搭建全行业产业链知识图谱,为政府产业规划、招商、企业服务提供数据支撑。

工作内容:完成20+数据源的质量评估与接入测试,设计分布式数据处理方案,完成亿级产业数据的清洗、标准化与入库,数据准确率达到98.5%;制定实体对齐、关系匹配算法方案,完成图谱构建,采用多线程导入技术将全量数据落地Elasticsearch,查询响应速度控制在200ms以内;构建行业发展评分模型与企业经营健康度评分模型,完成全量存续企业分级打分;负责图谱系统日常运维与迭代。

项目成果:完成127条全行业产业链图谱搭建,支撑经信委、科技局等政府部门产业报告输出,为券商提供定制化产业研报数据服务,累计创造营收超100万元。

E轮融资项目
角色:投资助理 (实习)
2020.11 - 2021.03

项目背景:完成对大数据领域标的公司的E轮投资,评估标的价值与上市潜力,实现投资收益最大化。

工作内容:通过Wind、乌龟量化等工具采集行业与公司数据,撰写大数据行业研究报告,梳理标的公司上下游产业链格局;参与标的公司实地尽职调查,协助撰写尽职调查报告,采用PE法、现金流折现法完成企业估值与未来收益测算,IRR预估达到22%;参与投决会汇报材料准备,维护与投资者的沟通。

项目成果:完成募资,成功对标的公司投资5000万元。

知识产权

一种产业链构建方法及系统 (已授权) 专利号:CN117633518A
信用评分卡模型优化方法及装置 专利号:CN120031657A
企业划分方法及装置 专利号:CN119066492A
异常根因定位的方法、装置及电子设备 专利号:CN119312241A