剑客
关注科技互联网

标签:中文分词

科技

年度盘点|AI 科技评论做过的语义识别公开课

阅读(183)评论(0)

2016 年是雷锋网 (公众号:雷锋网) AI 科技评论非常重要的一年,我们围绕人工智能做了一系列的业界、学界、开发者报道,也请了一系列导师大牛过来给我们做技术解读的公开课,在给这些导师大牛提供了一个绝佳展示舞台的同时,也给读者们带来了最...

技术教程

自动打Tag杂记

阅读(57)评论(0)

给一段文字标记 Tag 是一个很常见的需求,比如我每篇博客下面都有对应的 Tag,不过一般说来,Tag 是数据录入者人为手动添加的,但是对大量用户产生的数据而言,我们不能指望他们能够主动添加合适的 Tag,于是乎就产生了这样的需求:自动打 ...

技术教程

全文搜索:分词不在需要,按句子索引即可

阅读(60)评论(0)

摘要:一般来说的全文搜索服务,大体是基于字和关键词的,基于语句的全文搜索服务是一个有意思的课题。以文字为最小节点,以语句为分枝,建立语义树,提供基于语义树的全文检索服务。通过对语句进行语义特征编码,并结合数据库,来实现基于语义树的全文索引和...

技术教程

深度学习实战篇-基于RNN的中文分词探索

阅读(75)评论(0)

文 | haiping近年来,深度学习在人工智能的多个领域取得了显著成绩。微软使用的152层深度神经网络在ImageNet的比赛上斩获多项第一,同时在图像识别中超过了人类的识别水平。百度在中文语音识别上取得了97%的准确率,已经超过了人类的...

技术教程

使用wukong全文搜索引擎

阅读(108)评论(0)

近期项目中有一个全文索引和全文搜索的业务需求,组内同事在这方面都没啥经验,找一个满足我们需求的开源的 全文搜索引擎 势在必行。我们这一期对全文搜索引擎的需求并不复杂,最主要的是引擎可以很好的支持中文分词、索引和搜索,并能快速实现功能。...

技术教程

深度学习分词项目笔记

阅读(110)评论(0)

一直关注微信公众号“待字闺中”这周推送了两篇文章,关于深度学习中文分词,在周五的时候把整个项目开源了, 开源地址 ,准确率97.5% .

技术教程

jieba 源码解析

阅读(92)评论(0)

jieba分词 是Python 里面几个比较流行的中文分词工具之一。为了理解分词工具的工作原理,以及实现细节对jieba进行了详细的阅读。