对于大学学生而言,找到暑期实习机会或第一个全职工作职位无疑是件大事。这并非只是随便找一份工作,而是找到那份理想的工作。在无数符合职位要求的学生竞争有限职位的情况下,如何才能脱颖而出?应聘者如何能够得到众人梦寐以求的职位?

受到这些问题的启发,我和 Tyler Spagnolo、Shane Hepner 一起创建了 Aspire。Aspire 是一种可帮助大学生获取期望的实习机会和初级职位的工具。作为宾夕法尼亚州立大学学生搜索我们自己的实习机会的过程中,我们认识到发现各种途径的价值,优秀的学生能够利用这些途径得到我们寻找的职位,此外,我们还希望能够利用这些洞察,作为为他人定义途径的方法。

我们让 Aspire 参加了由宾夕法尼亚州立大学 EdTech Network 赞助的 Nittany AI 挑战赛。这项竞赛要求各团队开发基于人工智能的解决方案,改进宾夕法尼亚州立大学学生的体验、解决大学面临的实际问题,或者萌发创新的初创企业构想。2018 年 3 月,我们提供了 Aspire 原型参加第二轮评审,并获得了创建最小可行产品 (MVP) 的资助,当前我们正致力于完成这项产品,并将于 2018 年 9 月正式呈现。

以下更深入地介绍了 Aspire,以及我们如何使用 IBM Watson 来完成开发过程。

在前端,Aspire 让用户能够搜索具体的某一家公司和职位。它可返回他人得到该职位所使用的途径以及汇总的统计信息,例如,主要学科专业和技能。反之,学生可以使用过滤器(例如,年级或专业)来浏览途径数据库,查看与自身相似的可能职业发展途径。

为开发 Aspire,我们需要了解哪些经验帮助其他宾夕法尼亚州立大学学生得到我们关注的职位,包括参加的俱乐部、先前的实习机会及其拥有的相应技能。我们认识到这其中大部分信息都存储在各人的简历中。但 PDF 格式的数据为非结构化数据。

Watson 在此提供了帮助。为了从人们的简历中提取这些宝贵数据,我们使用 Watson Knowledge Studio 创建了机器学习模型。

首先,我们构建了一个 Type System,其中包含以下实体类型: Education, Organization, Position, DateRangeSkills。我们还包含了 Held_At 关系,用于将 Position 与其对应的 Organization 关联,同时还包含了 Held_For 关系,用于将 Position 与对应的 DateRange 关联。

运行 Python 脚本将 PDF 简历转换为文本文件后,我们的团队注释了样本文本简历语料库,标记了实体类型的实例及其之间的关系。对于初始原型,我们使用了 25 份简历来训练机器学习模型。尽管使用的训练文档数量较少,但对于实体和关系,我们分别实现了 F1 得分 0.75 和 0.58。

接下来,我们在 Watson Natural Language Understanding 中部署了自己的机器学习模型,这使我们在将原型开发成一个最小可行产品时,从大量简历中提取宝贵数据。随后,我们的应用用户即可查询由 Watson 生成的结构化数据。

我们认识到 Aspire 不必提供一整套获取职位的方法 – 所涉及的其他因素还有很多,例如,人际关系和软技能 – 但我们希望创建一个工具,帮助学生基于数据为其大学生涯作出明智决策。每年都有数千名学生从宾夕法尼亚大学毕业,我们的目标是利用他们所采用途径的数据,帮助其他学生实现自己的目标。

Watson Knowledge StudioNatural Language Understanding 在 Aspire 开发过程中发挥了重要的作用。我们的团队由本科一年级和二年级学生组成,在参加 Nittany AI 挑战赛之前,我们在人工智能和机器学习方面都没什么经验,但 Watson Knowledge Studio 让整个过程化繁为简。为文档添加注释、训练模型和将其部署至 Watson Natural Language Understanding 的过程轻松而简单,我们因此能够化构想为现实。

登录 IBM Cloud,即刻开始使用相关服务!

本文翻译自: How Watson can help Penn State students find their dream job (2018-08-15)

加入讨论