最新公告
  • 欢迎您光临牛品源码网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • SCWS简易中文分词系统 v1.2.2

    • 授权方式:共享软件
    • 界面语言:简体中文
    • 文件大小:未知
    • 更新时间:2014-02-01
    • 资源类型:国产软件
    • 推荐等级:★★★☆☆
    • 平台环境:Win2003,WinXP,Win2000,Win9X
    • 作者主页:点击查看
    • 演示地址:点击查看

    详细介绍 – [ SCWS简易中文分词系统 v1.2.2 ]

     SCWS是Simple Chinese Word Segmentation的首字母缩写(即:简易中文分词系统)。

    这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分成词。 词是中文的最小语素单位,但在书写时并不像英语会在词之间用空格分开, 所以如何准确并快速分词一直是中文分词的攻关难点。

    SCWS采用纯C语言开发,不依赖任何外部库函数,可直接使用动态链接库嵌入应用程序, 支持的中文编码包括GBK、UTF-8等。此外还提供了PHP扩展模块, 可在PHP中快速而方便地使用分词功能。

    分词算法上并无太多创新成分,采用的是自己采集的词频词典,并辅以一定的专有名称,人名,地名,数字年代等规则识别来达到基本分词,经小范围测试准确率在90%~95%之间, 基本上能满足一些小型搜索引擎、关键字提取等场合运用。首次雏形版本发布于2005年底。

    SCWS简易中文分词系统 1.2.2 更新日志:
    1) 改进中英夹杂的长词复合分法,比如 "奥迪A6/奥迪/A6"
    2) 修正 pscws23 演示文件的一些写法与新版 PHP 不兼容
    3) 修正一些 configure 检测错误

     

     

    RIPRO主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
    牛品源码 » SCWS简易中文分词系统 v1.2.2

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    站壳网
    一个高级程序员模板开发平台

    发表评论

    • 264会员总数(位)
    • 66769资源总数(个)
    • 1本周发布(个)
    • 0 今日发布(个)
    • 1860稳定运行(天)

    提供最优质的资源集合

    立即查看 了解详情