内容:对于两个C++程序,设计并实现两种不同的基于散列表的检测算法,计算两个程序的相近度,并分析
1. 分别读取两个C++程序文件(InFile1.cpp,InFile2.cpp),识别其中的关键词并统计频度,分别生成两个文件,保存关键词名称和对应频度(OutFile1.txt,OutFile2.txt)。
2. 自行设计散列函数,分别利用开放地址法和链地址法构建C语言关键词的散列表。在扫描源程序的过程中,每遇到关键词就查找相应散列表,并累加相应关键词出现的频度。
3. 根据统计的两个程序中关键词不同频度,可以得到两个向量。
4. 利用开放地址法和链地址法两种方法实现,分别输出s和两种方法计算s所用的时间,分析比较两种方法的效率。