语言及文法笔记

语言的定义与运算

字符的有限集合称为字母表，记为T
由字母表T中的字符构成的有限序列称为字母表T上的字符串
设 $\omega_1$ 和 $\omega_2$ 是字母表T上的字符串， $\omega_1=a_1a_2...a_m$ $\omega_2=b_1b_2...b_n$ 则 $\omega_1\omega_2=a_1a_2...a_mb_1b_2...b_n$
$T^*$ 是字母表T上所有字符串和空串的集合， $T^+$ 是字母表T上的所有字符串构成的集合，并有 $T^+=T^*-{\epsilon}$
字母表T上的语言L是 $T^*$ 的子集
两个语言 $L_1$ 和 $L_2$ 的积 $L_1$ $\cdot$ $L_2$ ,是由 $L_1$ 和 $L_2$ 中字符串的连接所构成的字符串的集合，需要注意 $L_1$ $\cdot$ $L_2$ $\neq$ $L_2$ $\cdot$ $L_1$
语言L的幂可归纳定义如下：
$L^0={\epsilon}$ $L_n=L\cdot{L^{n-1}},n\ge1$
语言L的闭包 $L^*$ 定义为
$L^*=\bigcup_{n\ge0}L^n$ 语言L的正闭包 $L^+$ 定义为 $L^+=\bigcup_{n\ge1}L^n$

文法(Chomsky文法体系)

文法G是一个四元组， $G={N,T,P,S}$ 其中
(1) $N$ 非终结符的有限集合
(2) $T$ 终结符的有限集合，且 $N$ $\bigcap$ $T$ = $\phi$
(3) $P$ 形式为 $\alpha$ $\rightarrow$ $\beta$ 的生成式有限集合，且 $\alpha\in(N\bigcup{T})^+$ $\beta\in(N\bigcup{T})^*$ 且 $\alpha$ 至少含一个非终结符号
(4) $S$ 起始符，且 $S\in{N}$
其中“ $\rightarrow$ ”含义是可被代替
字符串 $\alpha$ 是文法 $G$ 的句型，当且仅当 $S\Longrightarrow_{G}^{*}\alpha$ 且 $\alpha\in(N\bigcup{T})^*$ $\omega$ 是 $G$ 的句子，当且仅当 $S\Longrightarrow_{G}^{*}\omega$ 且 $\omega\in{T^*}$

文法的分类

0型文法

由定义1定义的不加任何限制的文法
由0型文法产生的语言称为无限制性语言

1型文法(上下文有关文法)

生成式的形式为 $\alpha$ $\rightarrow$ $\beta$ ，其中 $|\alpha|$ $\leq$ $|\beta|$ ，且 $\alpha$ , $\beta$ $\in$ $(N\bigcup{T})^+$ ,且 $\alpha$ 至少含有一个非终结符号。
P特点：每个生成式左部字符串长度小于等于右部字符串长度
由1型文法产生的语言称为上下文有关语言

2型文法(上下文无关文法)

生成式的形式为 $A$ $\rightarrow$ $\alpha$ , $A$ $\in$ $N$ 且 $\alpha$ $\in$ $(N\bigcup{T})^+$
P特点：每个生成式的左部是单个非终结符
由2型文法产生的语言称为上下文无关语言
其常见表示形式有
(1) 巴科斯范式(BNF, Backus Normal Form)

例：用BNF表示法描述十进制数的文法的生成式
<十进制数>::=<无符号整数>|<十进制小数>|<无符号整数><十进制小数>
<十进制小数>::=.<无符号整数>
<无符号整数>::=<数字>|<数字><无符号整数>
<数字>::=0|1|2|3|4|5|6|7|8|9

(2) 语法图

每一个语法图表示一个语法规则
圆边框或圆形框内书写的是“终结符号”
矩形框内所写的则是“非终结符号”
用语法图定义语法规则的过程类似于“自顶向下，逐步细化”的过程
语法图与流程图不同，语法图只规定了语法的内容和次序，与步骤无关

3型文法(正则文法)

右线性文法：生成式的形式为 $A$ $\rightarrow$ $\omega$ $B$ 或 $A$ $\rightarrow$ $\omega$ ， $A$ ， $B$ $\in$ $N$ ， $\omega$ $\in$ $T^*$
左线性文法：生成式的形式为 $A$ $\rightarrow$ $B$ $\omega$ 或 $A$ $\rightarrow$ $\omega$ ， $A$ ， $B$ $\in$ $N$ ， $\omega$ $\in$ $T^*$
由3型文法产生的语言称为正则语言

文法之间的关系(若无 $A$ $\rightarrow$ $\omega$ ，则为包含关系)

1、2、3型文法都是在0型闻法得前提下所加的限制，所以必然属于0型文法
1型文法不允许形式为 $A$ $\rightarrow$ $\omega$ 的生成式存在，所以具有 $A$ $\rightarrow$ $\omega$ 生成式的2型文法或3型文法不属于1型文法
如果2型文法或3型文法没有 $A$ $\rightarrow$ $\omega$ 生成式存在，则其属于1型文法

原文链接：https://blog.csdn.net/weixin_43931042/article/details/106216027