400-618-1990
新闻中心
智能知识库构建方法探讨
【工业软件学习营】第三期第5讲
【工业软件学习营】总第65讲,于2021年6月11日如期举行,本期讲师是北京瑞风协同科技股份有限公司仿真平台部技术总监,曾参与多个领域的设计仿真平台、材料库、知识库系统的建设, 有20余年软件开发和架构设计经验,重点研究方向为大数据技术与文本挖掘技术的。
本期课程重点分为以下四个方面:智能知识库目标、智能知识库构建方法、关键技术分析、未来展望。
一、智能知识库目标
- 构建知识库面临的主要问题
- 问题
- 知识库如何建
- 知识库有没有用
- 需要花多少钱
- 聚焦
- 建知识库的目标是什么
- 具体解决什么样的问题
- 想达到什么样的效果低速风洞
- 知识库三个主要目标
知识管理、知识工程、人工智能区别
- 知识库静态与动态区别
- 静态知识库
- 需要人主动查找
- 知识需要人主动补充
- 知识无需结构化
- 建设成本低,周期短
- 对信息化技术要求不高
- 动态知识库
- 根据场景智能推送
- 知识是主动的,人是被动的
- 可以自动采集业务场景的知识
- 知识需要结构化
- 建设成本高,周期较长
- 对信息技术要求较高:大数据、人工智能
- 可以分期建设,需要标准、规范来支撑
- 智能知识库目标
- 知识三个维度
- 认知维:知识管理 技术管理
- 逻辑维:创新设计 仿真试验
- 系统维:技术研发 产品研发
- 一图了解知识库
- 定位
- 静态库
- 动态库
- 知识体系
- 知识库方法
- 业务科室工作内容
- 知识智能定义
- 初级智慧工作平台应具有知识显性化、知识仓库、知识管理系统和知识集成应用系统,能够在本单位范围内实现知识共享;实现型号产品的快速研发、试制和验证;
- 中级智慧工作平台在初级智慧工作平台的基础上,有专家系统支持,具有动态知识的自学习、管理流程自优化能力,能够在本集团单位范围内实现知识共享;整体提升院所的可持续竞争优势;
- 高级智慧工作平台在中级智慧工作平台的基础上,具有自学习、自成长、自优化、自适应能力,具有一定的知识创造能力,知识应用范围更加广泛,达到组织、流程、技术和资源的动态优化配置,整体提升院所的自主创新能力。
- 知识库主要功能
知识应用平台应该具备四大基本功能,分别是知识重用、辅助决策与管理、自学习、知识创新。
- 知识重用,即从技术角度辅助人员在各类业务流程中做出最佳的技术决策,提供能解决实际问题的方案建议;知识的重用程度越高,其产生的价值就越大。知识应用平台有助于扩大知识的共享范围,减少知识获取的时间,从而提高知识被重用的效率和概率。
- 辅助决策与管理,即从管理角度辅助企业在制订各种政策和实施各项计划的过程中预防风险,做出最佳的管理决策。
- 自学习,即是让智能化系统能够完成数据和知识的自动更新与迭代,从而具备更优化的分析与决策能力,使得知识库不断地完善。
- 知识创新,即在平台的辅助下不断创造新知识,既包括技术创新又包括管理创新。正是在不断的交流与共享中,企业的知识资源才能被有效地开发和利用,从而推动企业知识资源在质和量上的不断增长。
- 重要技术和规范
- 大数据技术:海量数据存储、快速查找、备份恢复简单、管理成本低
- 人工智能技术:数据挖掘、文本挖掘、知识关联、知识场景化
- 知识采集技术: 批量自动采集
- 知识结构化技术:数字化、文本语义化、知识融合
- 知识表达规范:支持异构专业知识自由扩充,共享、传播简单方便
- 知识工程规范:站在信息化角度,告诉大家知识库构建的步骤
- 知识标准
- 2009年8月,中华人民共和国国家标准批准发布了2009年第6号公告(总第146号),正式颁布了编号为 GB/T 23703.1-2009 知识管理第一部分:框架的国家标准。该标准的实施日期为2009年11月1日。 2011年1月,国家质检总局、国家标准委正式发布了知识管理5项国家标准。分别为:第2部分-术语(编号GB/T 23703.2-2010),第3部分-组织文化(编号GB/T 23703.3-2010),第4部分-知识活动(编号GB/T 23703.4-2010),第5部分-实施指南(编号GB/T 23703.5-2010),第6部分-评价(编号GB/T 23703.6-2010),此5项标准的实施日期为2011年8月1日。
- 此5项标准主要起草单位:中国标准化研究院全国组织机构代码管理中心、北京信息科技大学。
- 知识体系
定义:把一些零碎的、分散的、相对独立的知识概念或观点加以整合,使之形成具有一定联系的、能解决业务问题的知识系统
- 单位知识现状
- 知识数据现状
- 有没有知识数据
- 知识数量多不多
- 知识数据的存在形式
- 知识专业分布情况
- 知识每年增长量
- 知识来源
- 知识应用现状
- 专业知识应用情况
- 跨专业知识应用情况
- 知识应用的效率高不高?
- 知识应用的效果好不好?
- 工程师对知识应用的反馈
- ……
二、智能知识库构建方法
- 基本思路
- 指导原则:
- 借鉴国家知识管理标准和智能院所思路,借鉴国外知识库建设经验
基本思路:
- 基于知识工程(KE)
- 采用大数据技术(Big Data)
- 人工智能技术(AI)
- 基于本体规范
- 五个基础步骤
三、关键技术分析
- 关键技术梳理
- 采集技术
- 文档自动采集技术
- 结构化技术
- 知识融合技术
- 管理技术
- 知识本体
- 知识工程
- 大数据技术
- 应用技术
- 知识插件技术
- 知识场景化技术
- 知识智能技术
- 采集技术
- 文档自动采集
采集插件:
- 开源插件
- 通用插件
- 定制插件:特殊格式,如CAJ
- 结构化技术
- 技术目标:信息数字化,为数据挖掘、数据分析做好准备
- 技术原理:针对不同格式的源始数据,构建相应的数字化解析插件,提取源数据的数字
- 技术难点:各类工程模型结构化难点大、成本高、周期长
- 知识融合技术
- 技术目标:把结构化的数字与语义化的文本有机的结合一起
- 技术原理:根据业务要求,把各类结构化知识规范化、编码化,通过规范的名称、编码自动融合
- 技术要点:不是单纯的信息化知识点关联在一起,更关注结构化数据与语义化文本之间的融合
四、未来展望
- 人工智能算法
- 算法:
- 是人们利用计算机解决知识挖掘的关键,是计算机智能的关键,算法的好坏、优缺决定着知识挖掘的结果是否准确、是否符合实际情况
- 算法分类:无监督、有监督、半监督
- 聚类,分类,神经网络
- 回归,异常检测,图形处理………
- 期望:
- 算法准确度进一步提升
- 出现更多领域的算法,百花争鸣
- 更多开源、开放的人工智能平台框架,特别是国产
- 更多开放型的标注数据
- 标注数据:
- 是告诉计算机如何做的数据,即被处理过的、能被计算机识别学习的数据
- 标注数据优点:
- 提升计算机自我学习能力
- 快速纠正错误
- 标注数据缺点:
- 标注工作量巨大,人力成本高
- 开源代码、应用可靠、拿来即用的软件产品
- 目标:
- 降低知识库建设成本和周期
- 期望:
- 拿来即用的软件侧滑角转迎角
- 常用的开源软件:
- 数据库类:MongoDB Redis Hbase Hive
- 全文检索:ElasticSearch Solor
- 计算平台:Spark
- 人工智能:NLTK GenSim
如果您对我们的课程感兴趣,欢迎扫描下方二维码进行听课!
上一篇:
轻量化MBD技术研究应用
虚实结合试验验证技术分析
下一篇:
新闻中心