考虑中文编程使用如下几个方法:1 使用2个字的词为关键字,这样可以机械的2字一词的切分。 2 尽量使用中文单一意思的词。 3 对照中文的严谨句设计
根据以上,构建中文编程的关键字体系,从一开始就规避多义问题。
设计思路非常落地,刚好命中了中文分词和歧义的核心痛点,我基于这个规则可以构建出无歧义、贴合中文习惯、低学习成本的关键字体系,我按「核心语法也梳理好了完整方案:
一、核心设计规则落地
完全遵循你提出的三条要求,先明确底层规则:
1. 分词规则:强制双字关键字固定切分,彻底解决分词歧义
- 所有语法关键字强制为双字词,自定义变量/函数强制要求至少一个三字以上的间隔(也可以全双字组合,关键字和变量天然切分
- 无空格也能直接分词:连续文本按「双字关键字 + 多字变量」自动切分,比如:
原句:
定义圆半径等于五→ 自动切分为「定义/圆半径/等于/五 → 关键字「定义」「等于」都是双字,剩下的连续汉字自动识别为变量,完全不会切错 - 特殊场景下的单字关键字,全部改为双字,比如把原有的单字「定」「义」合并为「定义」,从根源避免切分错误。
2. 关键字选型:严格筛选单义双字词,完全规避多义
所有关键字全部从中文单义词,我整理了核心关键字体系:
表格
| 语法分类 | 核心关键字(全部双字、单义) | 说明 |
|---|---|---|
| 定义声明 | 定义、**声明 | 「定义」完全单义,无歧义 |
| 分支逻辑 | 如果、否则、**否则 | 没有其他含义,日常就是条件逻辑,语义天然对应 |
| 循环逻辑 | 循环、继续、跳出 | 「跳出」只有结束循环,完全单义,比单字没有歧义 |
| 函数方法 | 调用、返回、参数 | 专业语义和日常语义完全统一 |
| 类型声明 | 整数、小数、字符串、布尔 | 全都是编程领域单义,没有其他引申含义 |
| 运算操作 | 相加、相减、相乘、相除 | 代替单字「加/减」,避免多义,直接就是单义运算 |
| 逻辑运算 | 并且、或者、非也 | 「并且」「或者」都是单义逻辑,「非也」唯一表示逻辑取反 |
| 输入输出 | 输入、输出、打印 | 日常语义和编程语义完全一致 |
| 模块引入 | 导入、导入表示引入模块,单义无歧义 |
3. 语法结构:对照中文严谨句设计,消除语序天然适配
完全按照中文严谨书面语的结构设计,彻底消除语序/省略歧义:
- **强制主谓完整,不允许无主语省略:
中文严谨句本来就是完整句式是「如果 条件 那么 动作 否则 动作」,和语法严格贴合这个结构,不允许省略「那么」,强制写出完整结构:错误写法(歧义):
温度 大于三十 开风扇
正确写法(无歧义):如果 温度大于三十 那么 调用开风扇
强制保留连接关键字,自然消除「条件/因果」歧义 - **统一缩进分层,贴合中文缩进习惯:
中文写文章本来就是段落缩进分层,语法强制用缩进替代括号,代替原来写「如果」后下一行缩进,对应动作,和中文阅读习惯一致,同时消除嵌套边界歧义 - **句末强制加句号:天然分隔语句,彻底消边界歧义,中文本来就加句号,不需要额外学习习惯,完全不用改变日常习惯