北京工业大学-编译原理--实验报告.docx
计算机学院实验报告课程名称:编译原理实验人学号:110703xx姓名:XXX实验完成日期:2022年5月20日报告完成日期:2022年5月20日目录实验一词法分析程序的设计与实现3词法的正规式描述:3状态图:4词法分析程序数据结构与算法:4词法分析算法:5实验结果:7实验中遇到的问题及其解决:81、保留字的检测问题:82、关于。为首位的数字是int8、intl和intl6的判断问题:83、关于回退的问题:8实验二自顶向下的语法分析一递妇子程序法9改写后的产生式集合:9化简后的语法图:9递归子程序算法10实验结果:13实验中遇到的问题及其解决:141、消除左递归,提取左因子之后的E、T对应的子程序的编写问题:142、缩进的控制:14实验三语法制导的三地址代码生成程序15语法制导定义:15三地址代码生成器的数据结构16三地址生成器算法:17实验结果:21实验中遇到的问题及其解决:221、根据化简后的产生式修改语法制导定义:222、使用真假出口法和继承属性来确定goto的标号:22实验一词法分析程序的设计与实现词法的正规式描述:标识符字母(字母1数字字符)*十进制整数O(I2i3456789)(01123456789)*八进制整数0(01234567)(01234567)*十六进制整数0(xX)(0l23456789abcdef)(0l23456789abcdeIf)*运算符和分隔符+-*/=();关键字ifthenelsewhiledo.状态图:lfthenwhiledoels词法分析程序数据结构与算法:/单词类classTokenpublic:inttype;/种别stringValUe;/属性值stringname;/单词具体内容Token()type=DEFAULT;value=NONE_OF_VALUE;Token(inttype,stringvalue,stringname):type(type),value(value),name(name)Token();词法分析算法:Token*TokenScan(ifstream&from_file)charch”/用于保存从文件中读取的字符读第一个字符inti=0;charvalue30=用来存放token的属性值ch=from_file.get();while(ch=BLANKch=TABch=NEWLINE)ch=from_fiIe.get();)/以下为标识符的检测/if(isalpha(ch)valuei+=ch;ch=from_file.getO;/判断后续的是否为工DN的成分(数字或字母)while(isalnum(ch)valuei+=ch;ch=from_file.get();)直到不是工DN成分,回退一字符from_file.unget();/TODO:这里加上保留字检测部分进行字符串的对比,即可比较出保留字,通过压栈的形式来获得完整的属性值/以下为保留字的检测/if(strcm(value,W0RD_IF)=0)returnnewToken(IF,NONE_OF_VALUE,WORDIF);if(strcm(value,WORD_THEN)=0)returnnewToken(THEN,NONE_OF_VALUE,WORD_THEN);if(strcmp(value,WORD_ELSE)=0)returnnewToken(ELSE,NONE_OF_VALUE,WORD_ELSE);if(strcm(value,WORD_WHILE)=0)returnnewToken(WHILE,NoNEJDJVALUEzWORDWHILE);if (strcmp(value,WORD DO) = 0)return new Token(DO, NONEJ)F_VALUE, WORD_DO);returnnewToken(IDN,value,value);Iflllllllllllllllllllll以下为数字的检测Iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiif(isdigit(ch)valuei+=ch;/如果第一个数字是O,则有可能是工NTlCl的Q、工NT8或INTI6if(Ch=,O,)ch=from_file.get();if(ch>=,O,&&ch<,8,)IIch=,x,ch=,X,)/如果。后面紧跟着数字0-8,则为工NT8if(isdigit(ch)while(ch>=,0,&&ch<,8,)valuei+=ch;ch=from_file.get();from_file.unget();returnnewToken(INT8zvalue,value);valuei+=ch;/到这一步的都是INT16ch=from_file.get();while(isdigit(ch)(ch>=,a,&&ch<=,f,)valuei+=ch;ToDO:这里没有解决Oxrtr的问题ch=from_file.get();from_file.unget();returnnewToken(INT16zvalue,value);else0后面的不为0-7的digit或X或X等8或16进制特征字符,则为10进制的0,回退一个字符from_file.unget();returnnewToken(INT10zvalue,value);)能到这一步的都是工NTl0,且不为0打头ch=from_file.get();while(isdigit(ch)valuei+=ch;ch=from_file.get();from_file.unget();returnnewToken(INT10,value,value);/以下为运算符的检测/valuei+=ch;switch(ch)case,+,:returnnewToken(ADDzvalue,+");casereturnnewToken(MINUS,value,caset*».returnnewToken(MULzvalue,"*,);case',:returnnewToken(DICzvalue,/");case,>':returnnewToken(MORE,value,">,);case,<,:returnnewToken(LESS,value,"<");casereturnnewToken(EQUzvalue,"=');case,(,:returnnewToken(LBRACzvalue,(");case,),:returnnewToken(RBRACzvalue,),);casereturnnewToken(COMMA,value,";");default:ErrorHandle(from_file);break;returnnewToken(DEFAULT,NONE_OF_VALUE,NONE_OF_VALUE);实验结果:实验中遇到的问题及其解决:1、保留字的检测问题:一开始的时候我的想法是遇到if、while,do、then等单词的首字母时即开始划分状态,后来发现这样子判断的分支会特别多,而且效率不是很高,对保留字集合的扩展支持的也不是很好。后来我发现保留字存在于标识符的子集,所以为什么不先判断标识符然后再判断是不是保留字呢?后来我就照着这个思路成功实现了功能。2、关于0为首位的数字是int8、intl和imi6的判断问题:当读入的第一个字符为。时,可能为int8、可能是intl的。也可能是intl6的开头,当下一个字符是07时,开始进行int8的匹配:当下一个字符是X或X时,开始进行intl6的匹配;当下一个字符为其他字符时,说明这是一个十进制的0(此时还需进行一字节的回退)3、关于回退的问题:有些时候需要进行同退,否则不能正常的进行完整个分析过程,需要进行回退的场合为:(1)匹配标识符(或保留字时),向后逐字读取的时候当下一个不是字母或数字的时候需要将读取的字符回退,才能继续向下进行;(2)判断为intl的0的时候需要一步回退:else/。后面的不为的digit或X或X等8或16进制特征字符,则为10进制的0,回退一个字符from_file.unget();returnnewToken(INTI0zvalue,value);(3)判断数字的时候到最后一个不为数字的都需要向退。实验二自顶向下的语法分析一递归子程序法改写后的产生式集合:S->id=E;S->ifCthenS;S->whileCdoS;C->E>E;C->E<=E;E->T(+T)*;E->T(-T)*;T->F(*F)*;T->F(F)*;F->(E);F->id;F->int8;F->intl;F->intl6;化简后的语法图:递归子程序算法intProcedures(ifstream&from_file)Indent();cout<<,S,<<endl<<endl;indentation+=4;/子程序开始Indent();Token*token=TokenScan(from_file);if(token->type=IF)cout<<token->name<<endl<<endl;ProcedureC(from_file);token=TokenScan(from_file);Indent();if(token->type=THEN)cout<<token->name<<endl<<endl;Procedures(from_file);elseexit(-1);elseif(to