简繁转换完全可以通过字替换来实现拆字也可以通过替换实现,毕竟只有7000个字,可以直接替换的,但是例如:女子->好,出现的频率相当高,因此这个是不能包括的,但是这样的单词绝对有限,有错误可以接受然后拆词能区分出这是字母列还是汉字列针对汉字列如果一个单词没有出现,采用word2vec直接生成即可如果一个单词出现在网络词表,没出现在规范词表,那么替换成规范词表即可如果一个单词出现在规范词表,也出现在网络词表(旧词新意),那么根据word2vec比较最适合的,填入之例如9菜->韭菜,生日快落->生日快乐简单替换即可,在规范词表绝不会出现但是对于出现过的词,例如白骨精->白领骨干精英,你不知道它就是白骨精还是白领骨干精英,这时候根据word2vec找最近的单词替换然后是单词和拼音,小于三个不考虑,直接送网络词表,判断是英语单词还是拼音看表因此对于这样的话,成功率是可以保障的,不至于,对于模糊的部分,就进行下一项大致思路就是这样了,拼音再用马尔可夫,这就能有很高的分了,神经网络是做不动如果时髦一点3-4语言半小时4-5微机半小时5-51单片机学习5-流水灯仿真之环境搭建5-66-7做系统晚上继续做单片机,直到碎觉搭建流水灯搭建液晶显示屏9-学习温传系统2-6做完硬件系统6-7干点什么晚上做语音处理7-大写首字母+下划线特别的清晰类的初始化,a:MyCss+{}.微信的post实现tent的美化