nlp笔试题


最近面试一家公司nlp岗位,这是当时出的一道算法题,时间比较紧没答出来,请教各位大佬
题目:用户在输入文本时偶尔会出错,假设给你一本结构化的词典,里面有所有词和每个词在文章中出现的频率,怎么样实现一个纠错方法。
a.假设文本时英文单词组成,键盘敲错的概率为q,如何实现一个纠错方案?尝试用代码实现你的方案。(提示:贝叶斯定理)
b.当文本时中文时,你上面的方案是否合适,如果假设中文是使用拼音作为输入法,上面的方案需要做什么样的调整?如果想提高准确性还需要什么信息?
已邀请:

要回复问题请先登录注册

返回顶部