一、整体方案思路 二、数据预处理 1.采样归一化:对mhd影像数据执行同构采样,统一映射为分辨率1mm*1mm*1mm体素,同构采样有利于CNN network 的任务训练。 2. 数据值域归一化: 采用min_HU: -1000 和 max_HU:400 筛选兴趣区域,并将区域的数据值域归一化为[0,1] 3. 数据增广处理: 针对有限数量的正样本做数据多样性增广,类似于医生通过不同的视角、不同的上下文去分析结节区域。增广数据的多样性,
提升训练模型的泛化能力。 4.肺分割: 4.1 在不同的slice上形态学处理,在Z轴方向根据overlap比例和mask面积大小修正; 4.2 通过抛物线验证check肺分割结果; 4.3 肺分割大大减少假阳性的引入,在网络预测阶段减少搜索空间(1=>0.1468); 三、结节预检测 1. 采用分割的方式获取candidate, 网络输入和输出size大小相同,均为48*48*48,same padding。 2. 保证结节在40*40*40的视野内。(部分大结节不做要求) 3. 预测时,在肺部采用滑窗处理,step为24, overlap的部分概率做max处理。 4. 3D-Unet其网络输入的数据特征是三个维度的,正如医生结合多个平面观察结节,捕捉到结节多样性特征。 四、结节精检测 在分割网络中,可能因为网络结构大小受限、随机负样本不够丰富等原因,这些误检区域的形态特征和结节的形态特征的差异性并没有得到充分的学习, 因此需设计一个假阳性衰减网络,有针对性学习,降低误诊率。 1. ensemble网络的思想来源,多个医生会诊的想法。inception1:医生1, resnet:医生2 densenet:医生3 2. 多尺度: 训练好48*48*48为输入的网络之后,采用36*36*36在源网络上finetune,不同视野大小对结节进行预测。 3.hard negative mining unet的输出的候选,排除已经标注的true positive,其它的作为难例,渐进式的送到网络里。 五、其他实验: 将 resnet,inception,densenet FC前一层的feature,feature个数分别为256,128,128,concat起来,尝试使用SVM,、RF、linear regression 再次训练一个假阳性衰减分类器, 其中RF效果最好,与通过weight权重比例进行模型融合的方式结果差别不大,因时间原因未做进一步尝试。
感谢复赛期间 intel和阿里同事的帮助,也感谢主办方给予一次难得学习与实战的机会。
|