【猎云网(微信:ilieyun)北京】3月9日报道(文/徐删删)
“森亿的医学自然语言的处理,是一个非常灵活的引擎,对主流的标准都有兼容性。”森亿智能的创始人张少典在采访中介绍到。
森亿智能专注于医疗文本的大数据方向,通过机器学习和自然语言处理技术自动抓取医学文本中的临床变量,将积压的病例自动转化为结构化数据,生成标准化的数据库。智能算法能挖掘变量相关性,从而对临床科研提供专业性的统计分析支持。
森亿智能的创始人张少典是哥伦比亚大学医学信息博士,曾在微软研究院、微软亚洲研究院、纽约长老会医院等从事医疗数据挖掘研究。丰富的行业知识,让他认识到目前国内医疗数据产业发展主要面临两个方面的难点:一是由于国内的医疗产业体质不同于国外,医疗属于强管制行业,优质资源集中在公立医院的手中。这一因素导致了国内的医疗行业是非纯商业因素驱动的产业,缺乏足够的商业动因来推动行业创新。
另一方面,由于目前行业内的标准还没有完全建立,导致了医院之间数据不联通,无法共享信息,加大了数据挖掘的难度;加之病例文本的质量参差不齐,如何筛选出有价值的高质量数据,继而打造高质量的产品,这是在中国医疗发展的现状下,需要克服的重要技术障碍。
针对这些痛点,森亿智能以算法模型和知识库两个方面入手,基于深度学习的方法,以模型支撑,结合临床的知识库,打造了一套医学文本的分析模型和解析流程。张少典认为,任何数据产品都是基于“学习+知识库”两个板块,但是核心的竞争力在于是否有能力进行:高质量的数据库的筛选和积累、扩大知识库的累积、以及精确的选择特定的方法和参数来解决特定的问题。
张少典告诉猎云网(微信:ilieyun),森亿智能的算法模型具有通用性特征,通过抓取体征、用药历史、临床症状等临床变量,可以在满足精确度的条件下大量地对常见病种进行处理。目前森亿智能的合作流程已经基本标准化,并已经在复旦大学附属中山医院,中南大学湘雅医院,复旦大学附属儿科医院以及长征医院打造了成功案例。
据张少典介绍,目前产品的精确度可以达到92%以上,智能水平相当于受过8年临床医学教育的医学研究生。而这一模型也会针对许多特殊和非常见的疾病,不断地进行模型增强和完善,争取用更高效的时间,做到更高的准确率。
由于不同的医院、科室以及医生之间的病例的质量都有所不同,但是等级越高的医院,对病例质量的管控就会越严格。因此,森亿用于模型训练的素材,主要来源于一线城市的三甲医院以及治疗方案需要严格依赖之前病史记录和治疗经历的科室,如血液科,消化内科等。但是公司本身不会获取数据,只是不断地进行模型的完善。
据了解,目前,在商业模式上,森亿智能的模型和解析流程已接入部分医院的平台,医院将电子文本信息录入流经模型,从而获取结构化数据。在这一过程中,主要有:项目采购的方式,采取一次性收费;第二是按年度收取的使用费用;三是按处理的病例量的调用次数收费这三种主要的收费模式。
据了解,森亿智能在2016年11月,完成天使轮近千万的融资,由真格基金领投,华岩资本和树兰医疗跟投。目前,森亿智能已经与北京大学、复旦大学,上海交大,美国哥伦比亚大学,纽约大学等学术的单位建立了长期医疗大数据研发合作关系。
项目:森亿智能
公司:上海森亿医疗科技有限公司
网址:www.synyi.com