知识图谱的概念及应用(上)

知识图谱的概念及应用(上)

时间:2020-3-29 作者:抖音代运营

那知识图谱和人工智能有什么关系呢?知识图谱是开启人工智能的第一步,知识图谱就像人的大脑,拥有海量的知识(数据)知识支撑,就可以为机器(人)更好的提供决策依据,帮助机器(人)学习成长,赋能于产品和业务,服务于用户(人)。

目录

  1. 什么是知识图谱
  2. 知识图谱的应用
  3. 知识图谱在HR Tech行业的应用
  4. 如何构建知识图谱
  5. 知识图谱的未

1、什么是知识图谱

知识图谱是一种语义网络,即有图结构的知识库。要理解知识图谱,先要理解“什么是知识?”和“什么是图谱?”

1.什么是知识?

百度:知识是符合文明方向的,人类对物质世界以及精神世界探索的结果总和。

通常我们认为的知识,是我们在实践中对于认识客观世界的成果,其中包括诸多,如事实、信息描述、实践技能、归纳总结的客观规律,发现论证的推导。知识也可以看成是构成人类智慧的最根本因素。而知识图谱中的“知识”是狭义的知识,是我们人为去界定的知识,可以是一个数字,一个日期,一个字符串,比如它可以是一辆自行车,一块广告牌这样的实物。

2.什么是图谱?

对于图谱我们可以稍微咬文嚼字,graph 即图,而我们称之为图谱,那么何所谓图?,图是知识的表述形式,图包含两个部分:

  1. 节点(node),节点即知识;
  2. 边(edge),边即关系;即以图的形式来保存知识。那何所谓谱,我们知道家谱,菜谱,食谱,那谱的意思即按照事物的类别、系统制表,也就是说图谱,不但需要能够以图的方式,结构化地表述知识,还需要对知识进行类别分类,归纳总结。

知识图谱概述:

根据知识和图谱的阐述,知识图谱的概念也明确了起来,即:整理总结业务中的知识,并建立这些知识之间的关联关系,最后以图的方式将其保存出来,并对这些知识进行分类,归纳和总结。

2.知识图谱的应用

当我们了解知识图谱的概念之后,那知识图谱可以为我们带来什么价值呢?接下一起看看知识图谱具体可应用在那些领域。

1、语义搜索

知识图谱这个概念是谷歌提出的,谷歌做知识图谱自然是跟搜索引擎相关,即提供语义搜索。这里语义搜索跟传统搜索引擎的区别在于搜索的结果不是展示网页,而是展示结构化知识。

当用户输入“jackie chan”,搜索引擎可以识别出jackie chan其实就是成龙,而且,会给出成龙的各种属性信息,比如说出生日期、国籍、配偶等。这些都是以前基于关键词的检索做不到的,有了知识图谱以后,就可以即问即答了。点击成龙的配偶“林凤娇”,可以直接进入她的知识卡片。

其次,还应用在各种app和网站的客服咨询问答系统中,通过匹配关键字词,给出对应问题的答案和猜你想问。

2、金融领域

知识图谱在金融领域的应用也非常广泛,主要体现在股票行情分析,信用评分,欺诈检测,客户关系管理等方面。

股票市场的趋势预测方面,通过机器学习算法分析上市公司的资产负债表、现金流量表等财务数据和企业经营数据,提取与股价或指数相关的特征进行预测。另外,利用与企业相关的第三方资讯,如政策法规、新闻或社交网络中的信息,通过自然语言处理技术分析舆情观点或情感指向,为股票价格预测提供支持,从而使预测结果更准确。

应用监督学习方法建立两个数据集之间的关系,从而使用一个数据集来预测另一个数据集结果,如用回归来分析通货膨胀对股市的影响等;无监督学习方法可以用于股票市场的影响因素分析,发现其背后的主要规则;深度学习适合非结构化大数据集的处理,提取不易于显式表达的特征;强化学习的目标是通过算法探索来找到最大化收益的策略。应用LSTM等深度学习方法,可以基于股票价格波动特征以及可量化的市场数据对股票价格进行实时预测,可用于股票市场的高频交易等领域中。

在信用评分方面,应用评分模型评估信贷过程中的各类风险,并对其进行监督,基于客户的职业、薪酬、所处行业、历史信用记录等信息确定客户的信用评分,不仅可以降低风险还可以加快放贷过程,减少尽职调查的工作量,提高效率。

在欺诈检测方面,基于收集到的历史数据训练得到机器学习模型,用来预测欺诈发生的概率。与传统检测相比,这种方法用时更少,且能检测出更复杂的欺诈行为。在训练过程中需要注意样本类别不均衡的问题,防止出现过拟合情况。

在客户关系管理(CRM)方面,从银行等金融机构现有的海量数据中挖掘信息,通过机器学习模型对客户进行细分,从而支持业务部门的销售、宣传和市场推广活动。此外,应用聊天机器人等综合人工智能技术可以全天候服务客户,提供私人财务助理服务,例如个人财务指南、跟踪开支等。在处理各种客户请求,如客户通知、转账、存款、查询、常见问题解答和客户支持方面,经过长期积累用户的历史记录,可以向客户提供合适的理财方案。

3、医疗领域

知识图谱可以用于预测患者的诊断结果、制定最佳疗程甚至评估风险等级。此外,还可以减少人为失误。在2016年JAMA杂志报道的一项研究中,人工智能通过学习大量历史病理图片,经过验证,其准确度达到了96%,这一数字表明,人工智能在对糖尿病视网膜病变进行诊断方面已经与医生水平相当。此外,对超过13万张皮肤癌的临床图片进行深度学习后,机器学习系统在检测皮肤癌方面超过了皮肤科医生。

4、艺术创作

图像处理方面的应用较多,特别是卷积神经网络(CNN)等对图像进行处理具有天然的优势,通过模拟人类视觉处理过程,辅以计算机视觉处理技术,知识图谱在图像处理领域应用广泛,除了图像识别、照片分类、图像隐藏等,最近几年图像处理方面的创新应用已经涉及了图片生成、美化、修复和图片场景描述等。

阿里的AI设计师鲁班就是通过机器学习算法,使用大量标注过颜色,风格等标签的图片对鲁班进行训练,才得以在每年的双十一能够每秒生成8000张海报。

5、网络安全

网络安全包括反垃圾邮件、反网络钓鱼、上网内容过滤、反诈骗、防范攻击和活动监视等,随着知识图谱逐渐应用于企业安全中,各种新型安全解决方案如雨后春笋般涌现,这些模型在分析网络、监控网络、发现异常情况等方面效果显著,从而保护企业免受威胁。

在密码学方面,机器学习主要用于密码的破解,例如通过分析通用符号密码的特征,以及目前常见密码的各种缺点,利用神经网络算法破解密码。

在垃圾邮件过滤系统中,如何提升过滤的准确性一直是一个难题。传统的机器学习算法包括贝叶斯分类器、支持向量机等分类算法,对正常和垃圾邮件中文本内容应用自然语言处理技术提取特征,并训练分类器判断垃圾邮件。

6、娱乐行业

知识图谱在娱乐行业的应用,通过大数据创建的智能分发模型,可为短视频平台实现内容的精准分发,如以智能内容分发起家的字节跳动公司,旗下的今日头条和抖音短视频。

在票房预测方面,把要预测的电影拿来和1990年以来的每一部电影进行比较,预测准确度可以超过80%。另外,把AI与知识图谱应用到分析娱乐行业的其他方面,例如,分析观众愿意为哪些内容付费等。

028-84360888 13608068886(推销勿扰) 发送短信