【202010276382.6】基于树状LSTM对生物医学文献的基因事件的抽取方法

        转让/许可方名称:天津大学滨海工业研究院有限公司
        转让/许可底价(万元):面议
        挂牌截止时间:2024年6月14日

本发明公开了一种基于树状LSTM对生物医学文献的基因事件的抽取方法:训练集、验证集和测试集的文本中出现的单词建立单词词典,实体、触发词、事件参数分别建立实体词典、触发词词典、事件参数词典,将生物医学文献的摘要数据处理为结构性数据;单词词典中单词映射得到向量,未被匹配的单词随机分配;事件触发词识别使用Tree‑LSTM结构,在事件元素识别中,使用最短依赖路径算法得到触发词和实体之间的最短路径,再使用Tree‑LSTM模型识别事件中事件参数及其扮演的角色;按照触发词识别阶段提供的触发词和原始文本提供的实体信息将事件参数词典转换为文本,生成事件参数信息包括事件类型、事件触发词、事件参数和事件参数类型。