2026知识工程课程总结
2026/6/30 22:53:51 网站建设 项目流程

产生式系统

  • 概念:一组领域相关的产生式(规则)互相配合、协同动作,一个产生式生成的结论可供另一个(一些)产生式作为前提或前提的一部分使用,以上述方式求解问题的一组产生式为产生式系统。
  • IF A THEN B; IF B and C THEN X
  • 产生式系统的构成:一组规则+数据基+一个推理程序(Engine)
  • 一组规则:每条规则分为左部和右部,左部表示条件,核查左部条件是否满足一般采用匹配方法,查看数据基DB(Data Base)中是否存在左部指明情况,存在则匹配成功执行右部规定的动作,否则匹配失败。
  • 数据基:产生式作用的对象,又是构成产生式(规则)的基本元素。
  • 一个推理程序(Engine):负责整个产生式系统的运行,包括规则左部与DB匹配;从匹配成功的规则中选出下一步执行的规则,执行右部规定的动作;掌握时间结束产生式系统运行。
  • 产生式系统的特点:
  • 格式相对固定:任何产生式都由左部和右部组成,左部匹配,右部动作,匹配提供的信息为成功或失败。
  • 知识模块化:知识元是不可分解的最小知识片。知识元集=知识库中所有产生式包含的知识元的集合。每条规则由知识元和逻辑运算符组成,规则(每个产生式)指明了知识元之间的关系,规则(知识片)存于知识库,规则间不能直接相互作用。如何使用规则的知识为元知识,元知识可以模块化表示成元规则,在少数产生式系统中可以实现。
  • 知识库的灵活性:知识与控制的明确分离方便知识库的扩充和修改,重点在于维持知识库的一致性、无矛盾性和完备性。
  • 间接性相互影响:产生式系统一般采用数据驱动,规则的调用通过修改DB间接实现。
  • 机器可读性:语法检查、语义检查和对产生式系统推出的结论进行解释。
  • 非确定性匹配:
  • 部分匹配:只需要某一产生式左部与DB中数据部分匹配上,即可触发该产生式并推出一些结论性信息(只要左边诸项中部分项为真,规则可被激活,右边项即为真)。通过规则压缩扩大了产生式系统的求解能力。
  • 两种权匹配:采用两种权确定知识元与规则之间的匹配程度。每项有两个权,第一个权表达充分性,第二个权表达必要性且两个权之间没有必然联系。
  • 推理算法:
  • 正向推理:使数据和产生式左部匹配,对匹配成功的产生式执行其右部。
  • 反向推理:把子目标和数据或产生式右部匹配,与数据匹配成功则生成叶节点;与产生式右部匹配成功则使该产生式左部成为新的子目标。
  • 动物识别专家系统ANIMAL:
  • 知识库:15条规则;
  • 解空间:7个解或最高假设(虎、豹、长颈鹿、斑马、驼鸟、企鹅和信天翁);
  • 初始事实:20个事实,F1~F20;
  • 数据、知识和推理均为精确的;
  • 初始事实节点——蓝色,中间结论节点——绿色;最高假设节点——黑色;绿色和黑色节点又被分为与节点、或节点和与或节点;
  • 数据基:启动之初数据基为空,推理结束前ANIMAL中数据基存储的事实不断增加,事实不能再增加时,运行结束。

  • 匹配冲突消解:
  • 匹配冲突:产生式系统推理过程中,在选择产生式和数据、子目标等方面产生二义性。
  • 解决策略:具备某种选择功能。按事先排好的固定顺序;按数据新鲜性排序;按子目标的新鲜性排序;按匹配程度排序。
  • 作业:设计混合推理算法,实现动物识别专家系统ANIMAL(深度学习+规则,输入是图片)

确定性因子理论

  • 使用确定性因子处理不确定性的方法,最初为专家系统MYCIN开发。
  • 证据趋向于积累,贝叶斯定理表达增量证据:

  • 随着证据积累数量增加,所需概率值数量增加更多。
  • 信任和不信任的度量:p(H)+p(¬H)=1,即p(H)=1−p(¬H)。对于依赖于证据E的后验假说H,有p(H|E)=1−p(¬H|E)。
  • 确定因子(Certain Factor,CF):在MYCIN中,确认度最初被定义为确定因子,是信任和不信任之间的差:CF(H, E) = MB(H, E)-MD(H, E),CF是证据E存在前提下关于H的确定因子, MB是由于E存在引起的关于H的信任增长的度量,MD是由于E存在引起的关于H的不信任增长的度量。
  • MB与MD之间的关系:同一个证据E不可能同时既增长了对假设H的信任,又增长了对假设H的不信任。
  • CF值的意义:确定性因子指出了对某证据的一个假说的纯的信任。
  • CF取正值意味着证据支持假说;
  • CF等于1意味着证据肯定地证明了假说;
  • CF等于0的情况为没有任何证据存在;
  • CF取负值意味着证据赞同否定假说,另一种解释为不信任一个假说的理由多于信任它的理由。
  • 确定性因子的计算:
  • MYCIN中的规则: IF E THEN H CF(H, E),其中E是规则的前件,H为结论,CF(H,E)是规则强度(当规则前件为真时,H为真的程度。
  • 两条规则后件相同,结论为不确定性值的综合。
  • 计算封闭性:计算前后取值范围一致。
  • 作业:计算H的不确定性。

  • 确定性因子的困难:
  • 优点:不确定性计算简单;信任和不信任清晰地被分开;能表达无知;直观易于理解。
  • 主要困难:有时得到的CF值和条件概率值相反;规则强度的概率独立未进行要求。
  • 成功的原因:比较短的推理链和比较简单的假设。

主观贝叶斯方法

  • 概率常作为理想系统中可重复事件的度量。
  • 概率指的是可重复事件,似然性指的是我们对非重复事件的信任度。 p(H|E):在某一证据E存在的条件下,专家对某一假设H为真的信任度。
  • 几率函数odds与概率函数有如下关系:当概率取值0到1时,必有几率函数取值0到∞。
  • PROSPECTOR是用于勘察固体矿的专家系统,基于贝叶斯理论采用规则表达领域知识,每条规则有两个规则强度,LS和LN。
  • 方框表示节点,E表示规则前提,H表示结论,LS是规则的充分性度量,LN是规则的必要性度量。除初始节点,每个节点有一个先验概率计为P(H)。
  • 概率传播:从叶节点到假说节点的逐步不确定推理。

  • 实际应用情况规定LS > 1且LN = 1的情况并不是罕见的,即证据的存在对假设H为真是重要的,该证据缺席对假设H为真没有影响。
  • 贝叶斯似然理论仅仅是能处理LS > 1且LN = 1的情况的理论的一种近似。

  • 公式(7):

  • 公式(8):

  • 作业:计算顶层节点 FRE的后验几率和概率值。


需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询