文 | 远山竹叶
编辑 | 远山竹叶

序言
高尿酸血症是近年来发病率不断上升的代谢性疾病,以是确定高尿酸血症药物的潜在技能机会以帮忙药物创新至关主要。

而技能路线图(TRM)可以有效地集成数据剖析工具,以跟踪最近的技能趋势并识别潜在的技能机会。
这种数据驱动的 TRM 包括以下三个方面:层映射、内容映射和机会创造。
首先我们处理图层映射。
BERT模型用于将网络的文献、专利和商业高尿酸血症药物数据映射到TRM中的技能层和市场层。
然后利用SAO模型剖析高尿酸血症药物的技能和市场层的语义。
然后我们处理内容映射。
BTM模型用于在技能和市场维度上识别高尿酸血症的核心SAO组成主题。
末了,连接预测模型用于识别高尿酸血症药物的潜在技能机会。
这种数据驱动的 TRM 有效地识别了高尿酸血症药物的潜在技能机会,并提出了实现这些机会的路子。
结果表明,复活人尿酸氧化酶的假基因,降落小分子药物的毒性,将是高尿酸血症药物的潜在机会。
基于已识别的潜在机会,比较不同来源的 DNA 序列并创造影响酶活性的关键氨基酸位点将有助于实现这些机会。
因此,为高尿酸血症药物供应了一个有吸引力的选项剖析技能机会。
高尿血酸的危害和技能
人体内的尿酸量须要保持在一个稳定的水平,当尿酸的合成增加或从体内排出的尿酸量减少时,血液中尿酸的浓度会增加。
当血液中的尿酸水平超过均匀水平时,就会被认为患有高尿酸血症。
像是高脂肪、高蛋白和高糖食品的摄入量增加会导致代谢紊乱和高尿酸血症的风险增加。
据估计,目前环球约有1770万高尿酸血症患者。
可以看出,高尿酸血症与许多其他潜在疾病呈正干系,例如肥胖、高血压、糖尿病、心血管疾病和慢性肾脏疾病。
治疗高尿酸血症的紧张方法是重新平衡尿酸合成和渗出。
治疗高尿酸血症的药物分为三类:黄嘌呤氧化酶抑制剂、尿酸阴离子转运体URAT1和尿酸氧化酶。
然而,这些治疗高尿酸血症的化学药物大多具有特异性副浸染,氧化酶类药物长期利用会产生抗体。
它们都不能溶解沉积在枢纽关头中的尿结石,高尿酸血症药物的技能创新势在必行。
开拓高尿酸血症药物的兴趣在不断增长,监测高尿酸血症的制药技能是剖析和识别潜在技能机会的根本。
这有助于缩小技能范围,降落研发风险,不仅支持高尿酸血症药物研究的决策,也有助于避免不必要的研发本钱。
TRM 是一种以综合办法捕获技能和市场随韶光变革的综合方法。
它不仅是一种剖析技能和市场需求的灵巧方法,而且还可以通过集成数据剖析工具创建一种更有效的跟踪和剖析最新技能趋势的方法。
制药技能创新受到各种成分的影响,例如不断变革的客户期望、不愿定的知识产权程序、未考虑的技能变革和资源需求。
有必要利用TRM从技能和市场两个维度剖析技能机会趋势。
此外,TRM 是缩短技能开拓周期、创造药物靶点和优化资源花费的宝贵工具。
TRM 的研究紧张分为三大类:基于理论的、以案例研究为重点的以及特定于数据的方法。
在 TRM 的浩瀚扩展中,数据集成是一个显著的趋势,一些研究职员在 TRM 中采取了数据驱动的方法。
只管先前利用TRM剖析TOA的研究做出了贡献,但数据驱动的 TRM 在三个方面存在一些局限性:处理数据数据驱动的 TRM、识别潜在机会和选择数据源。
从数据处理的角度来看,大多数先前的研究都采取基于关键字的网络剖析方法来进行数据驱动的TRM。
与识别潜在的技能机会比较,大多数研究职员从技能预测的角度依赖当前趋势。
技能机会剖析TOA过程包含六个紧张阶段。
它包括数据获取、描述、潜在关系提取、可视化、剖析结果,并确定潜在的技能机会。
当前的TRM没有识别潜在的技能机会,而是侧重于TOA的前五个步骤。
技能机会紧张基于技能热点,而技能机会每每存在于潜在联系中。
从数据源选择的角度来看,技能和市场变得繁芜起来。
同样的,一些关键技能信息不仅存在于专利中,还存在于文献和市场报告中。
因此,须要构建一个全面的数据驱动的TRM,从大量的文献、专利和商业数据中自动、快速、准确地提取技能和市场数据。
技能机会剖析
技能机会剖析TOA可探索潜在的技能机会,还可以通过深入挖掘出版物、专利和文献中的有效信息来更好地理解科学和技能发展。
许多研究职员已经开拓出有效的方法来识别和预测技能机会。
然而,信息急剧增加,仅凭专家知识无法始终如一地识别技能趋势,既费时又费钱。
此外,专家的判断每每受到个人专业知识和偏见的限定,有时会无法达成共识。
最初引入文献计量学是为了剖析新兴技能的技能机会,该方法已广泛用于剖析能源、导电聚合物纳米复合股料和机器人技能中的技能蜕变轨迹。
但是它只能反响知识流动、文献引用、专利等信息。
以是,它有一个韶光差。
然后在TOA中引入文本挖掘,适用于非构造化文本数据剖析,可以深入提取文本特色,例如机器学习和自然措辞处理。
一些研究侧重于开拓TOA中的自动化和半自动化数据剖析方法。
个中,主身分剖析PCA和文本聚类常被用于提取主题信息。
例如,Wu 基于 LAD、HMM 和共现理论预测了干细胞主题之间的进化关系,并利用主题模型来预测新药的潜在主题。
TOA 已经发展了很长一段韶光,并得到了许多学者的丰富。
为了有效地剖析潜在的技能机会,探索了各种数据剖析工具,这些工具在 TOA 中集成了数学、统计学、打算机科学和运筹学。
然而,这些方法不是独立事情,而是常常组合成一个新的、更有效的剖析路径。
技能路线图和数据驱动技能路线图
TRM 是一种基于韶光的多层图表,可以与各种数据剖析工具集成,在 TOA 中形成更高效的剖析路径。
基于 TRM 的技能机会剖析可以更好地识别技能的动态分布。
它还可以预测技能发展趋势并识别韶光序列中的潜在技能机会。
它常日由三层组成:市场、产品和技能层。
TOA 中 TRM 的现有研究紧张分为以下几类:基于理论的、以案例研究为重点的和特定于数据的方法。
技能路线图的构造
技能路线图的构造
关于基于理论的TRM,之前的一些研究紧张集中在TRM的观点和过程上。
为了支持市场拉动和技能驱动的创新,已经提出了新的 TRM 框架,例如 T-Plan TRM、基于学习的TRM或基于伞的TRM。
就以TRM为重点的案例研究而言,之前的一些研究侧重于将TRM运用于不同的行业或部门。
为了适应其他领域特定领域和特定案例的需求,已经开拓了TRM的定制。
TRM不仅存在于航空和航天部门以及电力部门的机器人技能,而且在敏捷硬件开拓和制药技能景不雅观开拓中也有 。
关于特定于TRM的数据及方法,一些先前的研究侧重于集成数据剖析工具以开拓有效的TRM。
TRM在构造和开拓过程中具有极好的灵巧性。
可以根据TOA的不同用场,灵巧选择各种工具构建TRM。
例如,研究职员将各种工具集成到 TRM 中,以适应繁芜的商业环境和大数据的兴起。
技能挖掘TM、层次剖析法AHP、商业模型画布BMC、交叉影响剖析CIA、模糊集理论等手段利用基于技能挖掘的专利剖析来制订技能路线图,以探索AI医疗创新。
此外,一些研究采取贝叶斯网络和主题建模等工具来开拓深度不愿定性下的风险自适应技能路线图。
随着大数据剖析的兴起和业务环境的快速变革,用于TOA的TRM集成数据和剖析方法越来越受欢迎。
越来越多的研究职员关注数据对 TRM 的主要性。
数据驱动的技能路线图逐渐被提出,数据驱动的TRM的数据来源越来越多样化,紧张包括专利、文献和商业数据,可用于数据驱动的TRM ,例如文本分类、择要、关键信息提取、主题聚类、语义剖析、导航、主题可视化和节点链接。
在方法学上
一个别系的来开拓数据驱动的TRM,以确定高尿酸血症药物的潜在技能机会。
它包含了三个阶段。
首先是层映射,基于BERT对文献专利和商业数据进行分类,基于SAO对技能层和市场层进行语义剖析。
第二阶段是内容映射,我们基于BTM为技能层和市场层确定SAO组件的主题。
末了一个阶段是探求机会,在链路预测的根本上,识别出节点间可能存在的链路。
数据驱动的TRM在技能路线图过程中有利于技能需求评估和技能相应开拓。
发起的模型由三个模块组成。
在数据采集上
目前,浩瀚的专利、学术论文、期刊和商业报告数据库包含大量技能和市场信息。
以构造化数据库格式存储,使它们成为数据剖析的有益来源。
由于在制订数据驱动技能路线图时须要技能和市场干系数据,因此采取Medline、Derwent Innovations Index和Abstracts of Business Information数据库作为数据源凑集。
这些数据为后续的部分奠定了根本,可以以连接的办法使之确定技能和市场层的 SAO 组件主题。
基于链接预测识别潜在连接
构建数据驱动路线图的核心是预测可能的技能机会。
然而,内容映射仅剖析过去的数据而忽略了未来潜在的技能机会。
因此,在这个模块中,我们选择链接预测来预测未链接节点之间的潜在链接。
首先,选择SAO中预处理的结果作为演习集,基于链接预测演习模型以构建全体网络。
末了,根据经由演习的链接预测模型确定所有未链接主题节点的潜在链接概率。
很有效的能够整合数据和技能的信息,并确定所有未链接主题节点的潜在链接概率。
整合 TRM 和剖析技能机会
如此大规模的网络是具有寻衅性的,因此我们只保留和解释技能和市场子网络了。
子网节点是从 BTM 提取的主题中选择的。
首先,我们在二维数据驱动的 TRM 中绘制韶光序列和层序列中的技能和市场子网络。
技能层的数据驱动 TRM 技能层分为C1C2、C、C4、Cs和C6六个社区。
技能层分为C、C2、Cs、C4、C,和C6六个社区,不同颜色的虚线循环突出了不同的社区,而且边的宽度和箭头的宽度表示未连接节点之间潜在链接的概率,边缘和箭头越宽,潜在链接的可能性就越高。
而技能路线图分为技能和市场两层。
例如,技能层沿纵轴分为三个子层,从子层S、子层A到子层O。
横轴是韶光段内排列的韶光序列,市场层也一样。
其次,我们选择潜在联系的技能和市场子网络中的节点和边缘,并在技能和市场层中将它们可视化。
如果两个未链接的主题之间存在潜在链接,则两个节点用带箭头的线链接。
而且边的宽度和箭头表示未连接节点之间潜在连接的概率。
然后边缘和箭头越宽,潜在链接的可能性就越高,再将链接预测可视化结果划分为技能和市场层的不同社区。
不同颜色的箭头边缘代表不同的社区主题,而不同颜色的虚线循环突出了不同的社区。
末了,我们根据终极的技能路线图剖析未来技能和市场发展可能的机会。
结语
用系统的方法来开拓数据驱动的 TRM,以确定高尿酸血症药物的潜在技能机会。
从技能预测的角度选择链接预测来识别数据驱动的TRM机会创造的潜在技能机会。
SAO考虑现有的技能联系,而技能机会每每隐蔽在潜在的关系中。
而SAO须要与链路预测相结合,更好地预测技能机会。
因此,根据链接预测识别未连接节点之间的可能链接的结果是,未来该当着重于复活人尿酸氧化酶的假基因,降落小分子药物的毒性。
从数据处理的角度来看,与基于关键字的剖析比较,我们选择SAO来提取关键技能信息,用于数据驱动的反响高下文的TRM的层映射。
SAO构造被广泛运用于专利、在线评论需求抽取、论文等文献剖析。
虽然 SAO 常日用于 TOA,但必须改进 SAO 构造以进行传出剖析。
因此,可以有效减少SAO的冗余。
除此之外,它还可以帮助提取技能办理方案的重点领域、办理方案的事情事理以及办理方案的哪些部分是 SAO 的目标。
基于链接预测确定的潜在机会,机会的实现路径由SAO构造推断。
从数据源选择的角度来看,为了识别与市场需求相同等的潜在技能机会,有必要从市场和技能角度剖析技能机会。
基于BERT从海量的文献、专利、商业数据中自动区分技能和市场数据,结合小领域演习集演习BERT模型,对高尿酸血症药物进行高精度分类。






