Indexed by:
Abstract:
本发明涉及基于句法树和领域特征的生物文本蛋白质指代消解方法,用于解决现有基于规则的方法中F值低的问题,其步骤包括:对原始文本进行预处理;从句法树中查找关系代词和距离该关系代词最近的名词短语,作为该关系代词的先行语;从句法树中查找人称代词,并从句法树的并列短语结构、子句句法树或前一句子的句法树中查找该人称代词的先行语;利用句法树得到限定性名词短语和候选先行语集,并基于生物领域特征如单复数、实体类型、数量等性质从候选先行语集中挑选出最优的作为先行语;非蛋白质指代消解过滤。本发明实现了生物文本中的蛋白质指代消解,能够获得较高的F值。
Keyword:
Reprint Author's Address:
Email:
Patent Info :
Type: 发明授权
Patent No.: CN201610872780.8
Filing Date: 2016-09-30
Publication Date: 2019-04-12
Pub. No.: CN106484676B
Applicants: 西安交通大学
Legal Status: 授权
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: