PHP前端开发

重构规则引擎 DSL

百变鹏仔 5天前 #Python
文章标签 重构

几年前,我重新实现了一种最初为工作中的规则引擎设计的领域特定语言(dsl)。该玩具重新实现是用 javascript 编写的(最初是用 python 编写的),并发布到 github。我没想到它能做太多事情,因为它是专门为一个非常具体的用例而设计的,我不应该透露。


bing副驾驶吐的一张有点可爱的照片

设计的主要目标是可以轻松序列化。图灵完备性不是问题,因为我只需要它做两件事:

  1. 简单的布尔比较(如果 x == 到 y)
  2. 从字典/哈希中的字段获取值

我首先开始用 python 编写匿名函数。然而,当我尝试将工作分散到一组线程/进程时,解释器抱怨 lambda 不可序列化。当时,我需要将逻辑置于主代码之外,因此我最终为此目的创建了 dsl。

首先想到的是 lisp,因为我喜欢代码有点类似于数组/列表。相似性是一件好事,因为我已经将配置存储在 yaml 中。因此,我不必担心创建一种新的方式来表示逻辑。

将语言保存为列表带来了另一个优点,我不需要从头开始创建解析器,即不需要标记/执行词法分析(词法分析器)。换句话说,作者就是词法分析者。我需要实现的就是获取输入列表,查找它是否是一个程序(我们称之为规则),然后根据上下文执行它。

const schema = ["condition.equal", ["basic.field", "foo"], ["basic.field", "bar"]];// returns a function that checks if context.foo === context.barconst rule = ruler.parse(rule)const context = {foo: "meow", bar: "woof"};rule(context) // returns false

一切顺利,符合预期。然后几天前我偶然发现了一篇用python实现方案的文章。我之前可能读过这篇文章,当时我花了很多时间学习 clojure。然而,这一次,我决定再次使用 python 重新实现该库。

所以这次我需要标记化,并自己执行词法分析器。如果我只处理数字,一切都很简单,但是当涉及到字符串时,事情就会变得更加复杂。我遵循了另一个教程,并重新发现了 make-a-lisp 项目。最终我放弃了,使用了hy-lang提供的词法分析器。

词法分析器采用 s 表达式,并返回类似于抽象语法树的结构。从那里,我通过遍历树来构建我的解析器,将规则作为以字典作为上下文的闭包返回。

import genrulerschema = '(condition.equal (basic.field "foo") (basic.field "bar"))'# returns a function that checks if context.foo === context.barrule = genruler.parse(schema)context ={"foo": "meow", "bar": "woof"};rule(context) # returns false

新的实施并没有真正的优势,因为我已经离开这份工作几年了。我留下的实现到目前为止可能仍然运行良好(最好是在经过多次迭代之后才实现)。然而,在整个旅程中我仍然学到了一两件事。如果您觉得这很有趣,请随意查看 javascript(它需要数组中的规则模式)或新的 python 版本(s-表达式)。