西门子TP900操作面板
表偏倚的可能性时发现了更多问题。这指表现出显著效果的论文比未表现出显著效果的论文更有可能被接受发表。他们的分析指出了发表偏倚的可能性,并发现如果根据可能的偏倚做出调整的话,那对质量的效果就完全抹去了,对持续时间的效果会从中等变成少许,对工作量的效果会有一点增加(这仅发生在一项特别的分析模式中)。
他们指出,混杂性和可能存在的发表偏倚可能是由干扰变数(也就是造成不同研究结果之间差异的变数)的存在所导致的。为了研究可能的干扰变数的影响,他们仔细查看了一项研究。那是迄今为止*大的一项研究,涉及295个对象,使用了三个级别的专业软件工程师(**、中级和初级)。他们任务的复杂性和结果之间可能存在相互作用。很复杂的任务可能在使用结对编程时能以大工作量为代价达到高质量,而低复杂度的任务可能以低质量为代价迅速完成。他们推荐研究者在将来的原始研究中关注干扰变数。是经验学习的论文,要么就是针对单个实践的研究,而并没有与其他可选方法比较所关注的技巧。
Dybå和Dingsøyr发现,一些研究汇报了XP存在的问题(在大而复杂的项目背景下),大多数讨论XP的论文发现它容易引入在不同环境下都运作良好。至于XP的局限性,他们发现有一些原始研究汇报了现场客户这个角色从长期来看不可行。
他们从敏捷方法的实证研究中找出了许多局限性。大部分研究只关心XP,而Scrum和精益软件开发分别
含的原始研究中有4篇是他们完成的)检测了成熟团队使用敏捷方法的情况。
从不同角度评估了现存证据的质量,包括研究设计的严谨性、单个原始研究的质量(在基本设计的约束下)、不同研究的结果一致程度、以及研究对真实软件开发的代表性。他们发现,证据的总体质量很低,他们出,除了XP以外的其他敏捷方法需要更多的研究,特别是针对成熟团队的研究,因为研究者可以使用更严谨的方法在时间紧迫和资源有限的情况下,自己完成了一项初步图谱研究[22]。在这种情况下,研究者应该使用一些技巧来评估主观决定的准确性,如Fink所建议的测试-再测试的流程[17]。
*后,关于质量标准,我发现很少有软件工程的系统性评审真正评估了各个单项研究的质 量[33][34]。质量判断是系统性评审的流程中不可缺少的元素,它对适当地集合原始研究的结果和解读结果都非常重要。在一次*近针对顺势疗法疗效的系统性评审中,我们可以找到低质量对研究结果影响的例子[46]。如果所有的研究都被包含的话,这种方法将项目分成三个阶段:项目前期、项目生命周期和项目后期。它基于9个原则:用户必须持息让我学习到了独立开发这样一个大型系统的经验。我发现Knuth介绍的很多错误类型在我自己编程的时候也有,也发现了很多不曾见过的问题,这些都让我可以更好地思考我的代码出问题的原因。作为一个研究员,我还从这篇文章中学习到了软件开发背后的人为因素,即:我们如何思考,我们的记忆是如何工作的以及我们如何做计划以及进行推理。这些都是影响软件质量的重要因素。和这篇文章类似的还有一些,它们把我引领到了一条研究人为因素的职业道路上,让我可以通过研究更好的编程语言、工具以及流程来改善软件的质量。
在阅读之后马上就学到东西的情况并不多见。我也是在读完之后的几个月中逐渐在自己的工作中意识到