入门新人请教:工作中机器学习用python还是java(利用工具包)?


请教个事,我原来是学图像处理的主要用c++,opencv,matlab,现在主要做一些数据相关的工作,一些机器学习方法可以自己写,但是我了解了下,python和java都有机器学习工具包,比如scikit-learn,mahout,那做这些相关的工作用python还是java呢,还是说如果用hadoop就要用mahout,是对应的?

这两个语言最近都尝试过,但是只是自己写一些方法,还没用机器学习的工具包,有经验的能说说用哪个更合适些么?还是说要坚持自己写,但是觉得成熟包的二次开发更靠谱些,目前这块刚开始展开,只有我一个人弄一头雾水。。期待大牛指点方向
已邀请:

jefflee

赞同来自: July 决心 algorithm_lr jzjie007


个人喜欢python,原因是包很多,比如数值计算的numpy/scipy,这使得matlab或者R的程序port到python很容易。自然语言处理有gensim,里边甚至实现了(相对)很新的word2vec。如果做中文分词,有个正在活跃开发的jieba(虽然bug还比较多,但开发人员更新很快),如果要抓网站数据,有个很完善的scrapy.

要回复问题请先登录注册

返回顶部