未知物成分分析是通过综合的分离和分析手段对复杂的未知化学品的成分进行定性和定量分析,为科研、产品生产、产品开发、改进生产工艺提供科学依据,为企业引进、消化吸收再创新提供强大技术支撑。
未知物成分分析覆盖电子、纺织、日化、塑料、橡胶等各个领域,具体包括:
Ø 助剂产品:纺织、皮革助剂(柔软剂、匀染剂、整理剂等);电镀(锌、铜、铬、镍、贵重金属)助剂(前处理添加剂、光亮剂、辅助光亮剂等);塑料和橡胶制品助剂(增塑剂、抗氧剂、阻燃剂、光和热稳定剂、发泡剂、填充剂、抗静电剂等);涂料助剂(乳化剂、润湿分散剂、消泡剂、阻燃剂等);线路板制造化学品助剂;电子助焊剂;陶瓷助剂;铝合金表面处理助剂;其它精细化工助剂
Ø 油墨产品:墨水,感光油墨等
Ø 化妆品:洗发、护发用品、护肤用品、美容用品、口腔卫生制品等
Ø 香精、香料
Ø 表面活性剂、民用和工业用清洗剂
Ø 有机溶剂: 油漆稀释剂,天那水,脱漆剂,电子、纺织、印刷行业用溶剂
Ø 水处理剂:缓蚀剂、混凝剂和絮凝剂、阻垢剂等
Ø 石油化学品:润滑油,切削液等
Ø 气雾剂、光亮剂、杀虫剂、脱模剂、致冷剂、空气清新剂等
Ø 高分子材料
Ø 其它化工产品
工业诊断分析是指通过样品或生产过程中微量污染物的鉴定,来查找工业生产过程中的质量事故原因的方法。
工业诊断分析需要综合运用各类常量、微量和痕量检测技术,主要成分与杂质成分鉴定并举,有机分析与无机分析并重,成分分析与生产工艺流程分析结合,尤其是对检测结果的分析和综合判断能力要求很高,才能对产品质量事故原因进行分析诊断。
工业诊断分析业务已涉及精细化工、医疗制品及临床、造纸、电镀、精密仪器制造、汽车生产等工业领域。
行业资讯:
数据分析
1. 3. 1 数据预处理 为提取单个细胞中有效的代谢组学信息,同时降低检测噪声、采样环境中外源
性物种等干扰,对数据进行预处理。
首先,使用 MSConvert 软件将来自 XCalibur 2. 2 的原始数据文件
(. raw)转化为 . mzxml格式,提取质谱峰(即 m/z值)及其对应的离子强度,形成代谢峰列表。
其次,对
离子强度进行归一化校正,去除采样溶剂背景信号,得到含检测离子及其相对强度的数据矩阵。
*后
采用“80%规则”[18]
和K近邻法[19]
消除缺失值,减少假阳性结果。
经过上述预处理操作后,迅速减小数
据集的大小,同时保留了来自单个细胞的基本代谢组学信息。
本文涉及的数据分析操作均基于Python
3. 8. 3实现。
1. 3. 2 分类方法 t分布随机近邻嵌入(t-SNE)[20]
是一种用于高维数据集的非线性降维技术,能实现对
微小群体的定性识别。
本文采用t-SNE降维可视化不同组中单细胞代谢谱的差异。
LDA是一种泛化性能良好的分类模型[21]
,其原理是选择一个合适向量使线性判别函数在该向量所在
方向上的投影达到极值,得到样本的*大类间散度和*小类内散度。
该方法在降维过程中能尽可能多地
保留样本信息,但其降维数有限(*多降到类别数-1维),可能因降维过度导致信息丢失。
RF[22]
是组合多
个决策树的集成学习方法,输出平均决策结果。
采用随机重采样技术Bootstrap ping和节点随机分裂技术
从原始数据集中重复随机抽取与原始数据集相同数量的多个样本构建子数据集,利用子数据集构建子决
策树,然后融合各个子决策树的预测结果。
SVM[23]
是一个通过寻找能够*大化区分不同类别数据集的*
优超平面的广义线性分类器。
对于线性不可分情况,利用核函数将数据映射到高维空间使其线性可分。
LR[24]
是通过建立响应变量与自变量之间的逻辑函数并使其*大化,从而达到*小化贡献较少变量的影
响。
本文将上述方法应用于单细胞代谢组学质谱数据集,对整个数据集(n = 395)执行五次十折交叉验
证,取统计平均结果作为*终分类结果,以减少数据分割对结果的影响,使分类结果更可靠。
1. 3. 3 性能评估 本文采用准确率(Accuracy)、灵敏度(Sensitivity)、特异度(Specificity)等评价指标
衡量模型的分类性能。
准确率是反映模型正确预测样本的能力,其计算公式见式(1),其中 ncorrect表示