

人工录入
用双人背靠背独立完成数据提取,再相互比对。避免随机错误
如朗读校验:1人朗诵,1人核对
保证数据一致性
培训、预提取、格式限定、定期讨论、
不定期抽查!
程序提取
脚本
正则表达
通过定制开发程序脚本,实现自动化提取,提取后由数据核查团队逐一核查提取结果,总结错误及错误原因
专有模型提取
如疾病、症状、检验特定名词专有名词提取模型
结构化模型如现病史结构化、主诉结构化
智能体提取
大模型
思维链
上下文NLU
知识图谱
通过训练数据提取大模型,结合知识图谱,并依据上下文和校验规则理解,
实现灵活、准确度高的数据提取。