RSS 图林小小生
哪吒推荐该订阅
原站:http://blog.sina.com.cn/maris
指数:
点击立即订阅,“图林小小生”的内容有更新,哪吒第一时间提醒您
“图林小小生”的内容更新
累计:238 篇(自 2009-05-22 起)
更新:约2篇/周,最后更新1 天前
图林小小生
dna分词的第一版终于写好了。。。。。。。。。,后面除了修改,征求意见外,还要尽快把相关的代码给整理好,这两周先把论文的基本错误给改了,然后把代码整理好了。东西发出去找些人看看,征求一下意见。 论文就是改出来的,争取3月初把稿件给投出去。... (1 天前)
图林小小生
dna目前的主要问题:1 如何判定不同基因组使用的是同一种语言。2 分词词典如何构建,主要是不同字长的词如何合并的问题。... (11 天前)
图林小小生
2012年就等着看地球大爆炸了大致安排一下今年的规划,要是这几年还没有什么研究成果,估计后面就越来越难啦,历史证明。今年的目标。... (14 天前)
图林小小生
论文规划1 2月5日之前,提交到arxiv,整理程序,发mail,征求意见。2 2月12日之前,把词的构建再搞一搞,按照意见改一改。3 2月19日之前,把文章给投出去。 知道算法,要能够迅速给出数据结构和实现的方式,这种技能还需要在实践中不断的提高,这是工作的基本技能,一定要熟悉。... (14 天前)
图林小小生
下个周末之前,先把文章先写完整了,放到arxiv上,字长的先不要纠结,后面主要是词典的构造方面,把相关的数据结构,还有前向、后向稳定性之类的再总结一下,搞出一个稍微正式的词典出来,字长不用太长,12就行,防止内存溢出。 现在开始挖坑不灌水,哈哈 ... (15 天前)
图林小小生
论文计划1 1月23号之前把文章给写好了,写成一般的格式,先搞到arxiv上,发给几个老大看看,接受一些反馈意见。2 2月底之前把文章给投出去,这个应该能中个大的,哈哈。... (28 天前)
图林小小生
用srilm处理一个3g的语料,训练3元语言模型,32g内存根本就不够用,比cmu那个差远了,不过cmu的没人维护了。 srilm的faq里面给出了一个解决方案。就是把文件给分开了,然后分别算词频并merge起来,做成一个语言模型,具体见:http://www-speech.sri.com/projects/srilm/manpages/srilm-faq.7.html 其基本方法:1 把文件给分割开,放在一个目录下,然后生成一个文件名列表文... (29 天前)
订阅者 ( 1 )
gsmstock
相关订阅源
RSS 董路的BLOG

董路,电视节目主持人,媒体评论人,足球评论员。媒体圈将跨界进行到底的代表人物。

标签: 董路的blog 董路 博客 体育 名人

指数 | 95人订阅  

我要反馈