C#汉字转拼音,可识别多音字,带声调,提供正向、逆向、双向分词算法的小程序

8/3/2015来源:C#应用人气:2165

C#汉字转拼音,可识别多音字,带声调,提供正向、逆向、双向分词算法的小程序

用C#写了个汉字转拼音的小工具,和网上大部分工具不同,这个通过分词算法,解决了多音字的问题,并且提供声调,可开可关。

如题,用"银行 行不行 行家说了算"举例,如果转拼音却不能识别多音字,就惨了。

而这个小工具的效果如图:

C#汉字转拼音,可识别多音字,带声调,提供正向、逆向、双向分词算法的小程序

实现了3种分词算法:* 正向最大匹配* 反向最大匹配* 双向最大匹配(这个双向匹配的歧义处理办法,还是本人创新。。。)

C#汉字转拼音,可识别多音字,带声调,提供正向、逆向、双向分词算法的小程序

软件下载:http://pan.baidu.com/s/1mTg3T

-----------------分割线---------------------

这里,不得不提一下分词算法这个事情。

不过都写在这就太长了,还是放到下一篇再谈。

-----------------源代码(含生成好的程序)--------------------

百度网盘:http://pan.baidu.com/s/1ED1Ls腾讯微云:http://url.cn/PnnMOU

使用注意:* bin/release目录下,已经包含了生成的软件。

* 显示拼音时,因为词库的中文单字非常不全,我引用了微软的ChnCharInfo.dll,来获得一些单字拼音。这个库是要下载Visual Studio International Pack安装到系统才会有的。

不过你可以直接从bin/release里面找到,自己重新引用一下就行了。只需要引用:ChnCharInfo.dll,但下面2个文件也不能删掉ChnCharInfo.xml和zh-CN目录下的ChnCharInfo.resources.dll