博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【语言处理与Python】5.7如何确定一个词的分类
阅读量:5103 次
发布时间:2019-06-13

本文共 507 字,大约阅读时间需要 1 分钟。

形态学线索

从词的内部结构可能为这个词分类提供有用的线索。

例如:

-ness与形容词结合可能是一个名词;

-ment是与一些动词结合产生一个名词的后缀;

英语的动词也是形态复杂的。

例如:

-ing有可能是现在分词、也有可能是动名词

句法线索

一个词可能出现的典型上下文

例如:

假设我们已经确定了名词类,我们可以说,英语的形容词的句法标准是可以立即出现在一个名词前,或者紧跟在be或者very的后面

语义线索

一个词的意思对其词汇范畴是一个有用的线索。

新词

比如很多的新词都是名词,这些名词属于开放类;

介词被认为是封闭类,因为只有有限的词汇属于这个类别;

词性标记集中的形态学

例如有的词却有不同的形态,在更细粒度的分词上需要注意:

形式 类别 标记

go 基本 VB
goes 第三人称单数 VBZ
gone 过去分词 VBN
going 动名词 VBG
went 一般过去时 VBD

总之,没有一个“正确的方式”来分配标记,只有根据目标不同或多或少有用的方法。

转载于:https://www.cnblogs.com/createMoMo/archive/2013/05/26/3100144.html

你可能感兴趣的文章
Dirichlet分布深入理解
查看>>
(转)Android之发送短信的两种方式
查看>>
python第九天课程:遇到了金角大王
查看>>
字符串处理
查看>>
HtmlUnitDriver 网页内容动态抓取
查看>>
ad logon hour
查看>>
获得进程可执行文件的路径: GetModuleFileNameEx, GetProcessImageFileName, QueryFullProcessImageName...
查看>>
证件照(1寸2寸)拍摄处理知识汇总
查看>>
罗马数字与阿拉伯数字转换
查看>>
Eclipse 反编译之 JadClipse
查看>>
Python入门-函数
查看>>
[HDU5727]Necklace(二分图最大匹配,枚举)
查看>>
距离公式汇总以及Python实现
查看>>
设计模式之装饰者模式
查看>>
一道不知道哪里来的容斥题
查看>>
Blender Python UV 学习
查看>>
window添加右键菜单
查看>>
入手腾龙SP AF90mm MACRO
查看>>
python学习4 常用内置模块
查看>>
Window7上搭建symfony开发环境(PEAR)
查看>>